小说园

小说园>科研系学霸起点 > 第82章 黑色星期一(第2页)

第82章 黑色星期一(第2页)

“我倒是希望代码出bug了,看看这篇文章吧。”他将屏幕转动了一下,让其他人能看得清上面的论文题目。

第82章黑色星期一

“R1:RedefiningCost-PerformanceTradeoffsinLarge-ScaleLanguageModels?”

旁边的同学Sarah搜了一下,果然找到了这篇刚刚发布不久的文章。

“这是哪个公司的成果吗?”因为作者的名单上长长一串一般只有公司的文章才会这样。

“就是DeepSeek,之前他们不是发过一个V3版本的论文吗?当时老板还让我们看过,你不记得了?”

“哦~好像有点印象,怎么,这篇R1有很大的提升吗?”他一边说着一边看向下面的摘要部分。

“Reinforcementlearning(强化学习)?这不是和我们现在做的方向一样吗?”不过当他看到第一张图片的时候不由得歪了歪脑袋,发出了同样的惊呼:“Holy*&#$?真的假的?”

图片上面显示了,其效果几乎和GPT-o1持平,而且文中写到了其推理成本的二十分之一还不到。

Leo苦笑着摇头“不知道,我希望是假的,但我感觉应该是真的。”

搞科研最为悲伤的事情之一——你有了一个很好的idea,并且已经做了一段时间,就在快要有成果的时候,却发现人家已经做出来了,而且比自己做的更好。

好消息:LLM有了新的突破,坏消息:你论文白写了。

“哎~没办法,我再看看吧,如果是真的,估计老板肯定会要求我们复现的。”

“说的也是。”

和他们一样反应还有很多人,公司的工程师们,高校的学生老师,对搞科研的人来说熬夜是常态,所以哪怕论文是在夜里发的也有很多人看到了这篇文章。

仅仅是论文发布后的第二天,各个视频网站或者学术论坛上就涌现出了不少针对R1的解读。

之后几天,随着不断有人成功复现出DeepSeek,谷歌、Meta等大厂的AI部门负责人连夜召集紧急会议。

因为DeepSeek的低成本将有可能会直接威胁到所有依赖高收费模式的云服务和AI公司的盈利预期。

很快,市场上谣言四起,比如什么多家云服务提供商正在紧急重新谈判未来的GPU采购合同,规模可能大幅缩减。

这一类的传言难辨真假,这就导致了在极度敏感和恐慌的市场情绪下,成为了压垮骆驼的最后一根稻草。

DeepSeek的成功让资本市场看到了开发成本较低的强大AI模型的可能性。

27号,正好是周一,美股开盘。

周昀提前候在电脑面前,两块屏幕,一块屏幕放着电影,另一块屏幕显示着英伟达的股价。

桌上还摆着一盘小零食,他盘着腿靠在椅子上,巴适的很。

和记忆中新闻报道的一样,刚一开盘Nvidia就以无可匹敌之势一路下探,除此之外,其他芯片股也集体大跌。

周昀吃着零食笑呵呵地看着下跌的股价,心里冒出一个念头,也不知道老黄现在是个什么表情。

反正他的嘴角是真的难压。

已完结热门小说推荐

最新标签