遇初小说

手机浏览器扫描二维码访问

第43章 又双叒叕突破啦(第1页)

孟繁岐的这番话,听起来让人觉得不是那么舒服。

言下之意,给人一种华国AI技术就是不如国外的感觉。

这是李彦弘不大喜欢的,毕竟他这么早就关注AI技术,就是为了研发最前沿最先进的技术。

孟繁岐大概猜到了他的想法,前世他也曾被早期华国大量发表的AI论文所迷惑。

觉得在这个新崛起的技术上,华国已经可以和美国分庭抗礼,不落下风。

虽然AlphaGO震惊了世人,但毕竟有些华而不实。

直到上千亿级别的语言大模型出现,这种纯硬核实力的比拼,让孟繁岐不得不甘拜下风。

实际上,并非是技术手段和算法层面上相差太远。

更多的还是因为优质数据的数量不足。

白度的文心一言,出图的时候甚至会将用户的中文输入翻译成英文,再去作图。

很多较真的网友故意测试了中英文差异很大的词汇,比如总线(Bus),鼠标(mouse)。

文心一言绘出的图像竟然是大巴车和老鼠,这从中文上是完全说不通的事情。

可见即便不是全部,文心一言这个所谓的专注中文的超级大模型,也在相当程度上借助了英文基础的模型权重和技术。

究竟为何要这么做,说到底还是基础不够扎实牢靠。

整理数据,清洗数据,给数据打上高质量的标签。

这些都是脏活累活,见效慢的工作。

把别人公开的数据拿过来跑一跑训一训,多么方便快捷?

以国内996大厂的内卷风气,很难容下长回报周期的基础建设。

早些时候看看不出区别,只觉得国内大厂频繁在XX榜单上露面,刷榜,又是超过这个,又是超过那个。

直到语言大模型阶段,基础语料数量和质量上的劣势才暴露无遗。

“其实这也不能完全怪华国的大厂风气,美国的互联网起步要早,并且很多领域的文献材料归档做得特别好。”孟繁岐也曾仔细思索过这方面的问题。

“像github,arxiv这样的大型公开社区,里面都是非常优质的外文代码或者论文。这些也不只是美国人自己的积累。而是通过免费公用的形式,收割了全世界的数据。”

“华国人在github上贡献的代码行数也不在少数,反过来看看华国的论文社区,就比如知网,纯纯就是毒瘤。里面屯点硕博生的论文,还要论页数收费。就连下载之后的阅读器,甚至都需要专门的....”

此消彼长之下,差了多少珍贵的数据啊...

热门小说推荐
洪荒:我人族圣师,开局创建武道

洪荒:我人族圣师,开局创建武道

穿越到洪荒世界,成为三千先天人族之一,然人族新生,并无修炼之道,为了自己与人族的未来,林辰毅然决然的利用了前世的经验和知识,创造了适合人族的修炼之道武道!  不过,由于底蕴天资不足,林辰创造的武道有缺,最高只能修炼到武道真仙之境,再往上便无前路。  这时,最强圣师系统开启。  只要林辰传授武道给予弟子,便可获得他们天资,感悟乃各位书友要是觉得洪荒我人族圣师,开局创建武道还不错的话请不要忘记向您QQ群和微博里的朋友推荐哦!...

快穿:反派终于黑化了

快穿:反派终于黑化了

快穿反派终于黑化了是磬歌精心创作的灵异,旧时光文学实时更新快穿反派终于黑化了最新章节并且提供无弹窗阅读,书友所发表的快穿反派终于黑化了评论,并不代表旧时光文学赞同或者支持快穿反派终于黑化了读者的观点。...

萌妻反扑:总裁请接招

萌妻反扑:总裁请接招

拔出去,啊,好疼男人勾唇,难道不是刚好么?不好,痛痛痛忍忍,我轻点。最后,只好把尺寸偏小的戒指取下来,看着她红红的无名指,勾唇,宝贝,你可真是个小娇娇。...

我真的没有偷那个蓝BUFF啊

我真的没有偷那个蓝BUFF啊

打野菜鸡中路,为什么偷我蓝BUFF?姜琦???我没有偷啊?上路不要不承认!射手看看你的脚下,还说没有偷?辅助菜就菜,偷了还不承认,人品有问题。姜琦大哭我真的没有偷那个蓝BUFF啊~姜琦现在有些崩溃,因为一个王者荣耀中的蓝BUFF,他好像来到了什么不得了的地方...

地球人真恐怖

地球人真恐怖

异界降临这是一款不简单的游戏,里面的NPC才是真正的玩家,而这些来自地球的玩家则是他们的棋子,若是有地球人敢怀疑他们,质疑他们,违逆他们,那么这类人会被清除,现实中也会死亡。即便这样,地球人依旧不觉得自己是他族人的棋子,反而还觉得这是上天的垂怜,神明的恩赐。直到有个青年被定义为反派的异族附身时,他才得知真相,于是决定要让这帮敢玩弄他们的玩家认识到什么才是真正的玩家!...

从水浒开始的好汉之旅

从水浒开始的好汉之旅

带着半瓶53度茅台白酒的曹军,穿越到水浒传的世界中,遇到了一间‘三碗不过岗’的小店,还有一位号称千杯不醉的壮士。曹军欣然的和壮士分享了这半瓶白酒。结果壮士丧于虎口,曹军成了打虎英雄,并捡到一本秘籍。...

每日热搜小说推荐