pc28

加拿大pc28预测在线开奖 Meta堕入焦炙?里面爆料:在猖獗分析复制DeepSeek,高预算难以解释

发布日期:2024-09-06 20:06    点击次数:67

机器之心报谈

机器之机杼剪部

「工程师正在猖獗地分析 DeepSeek,试图从中复制任何可能的东西。」

DeepSeek 开源大模子的阳谋,切切实实轰动着好意思国 AI 公司。

伊始堕入焦炙的,似乎是通常珍摄开源的 Meta。

最近,有 Meta 职工在好意思国匿名职场社区 teamblind 上头发布了一个帖子。帖子提到,国内 AI 创业公司 DeepSeek 最近的一系列行为让 Meta 的生成式 AI 团队堕入了焦炙,因为在前者的低资本呐喊大进下,后者无法解释我方的超高预算的合感性。

原文如下:

这一切始于 DeepSeek-V3,它在基准测试中就照旧让 Llama 4 过期。更灾祸的是阿谁「领有 550 万锻真金不怕火预算的不盛名中国公司」。工程师们正在猖獗地分析 DeepSeek,试图从中复制任何可能的东西。这小数齐不夸张。料理层系念如何解释宏大的生成式 AI 组织的资本是合理的。当生成式 AI 组织中的每个「指引」的薪资齐比锻真金不怕火通盘这个词 DeepSeek-V3 的资本还要高,而咱们有好几十个这么的「指引」时,他们要如何濒临高层?DeepSeek-R1 让情况变得愈加可怕。固然我不成炫耀神秘信息,但这些很快就会公开。这本应该是一个以工程为要点的微型组织,然而因为许多东谈主思要参与进来分一杯羹,东谈主为地延迟了组织的招聘限制,服从每个东谈主齐成了输家。

原贴通顺:https://www.teamblind.com/post/Meta-genai-org-in-panic-mode-KccnF41n

目前,工作室负责人赤塚哲也在LinkedIn工作记录中删除了樱花工作室。

帖子中提到的 DeepSeek-V3 和 DeepSeek-R1 差异发布于 2024 年 12 月 26 日和 2025 年 1 月 20 日。

其中,DeepSeek-V3 在发布时提到,该模子在多项评测收货卓绝了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模子,并在性能上和天下顶尖的闭源模子 GPT-4o 以及 Claude-3.5-Sonnet 不分昆仲。

不外,更引东谈主柔软的是,这个参数目高达 671B 的大型言语模子锻真金不怕火资本仅 558 万好意思元。具体来说,它的预锻真金不怕火流程居然只用了 266.4 万 H800 GPU Hours,再加上高下文扩展与后锻真金不怕火的锻真金不怕火,统统也唯一 278.8 H800 GPU Hours。相较之下,Meta 的 Llama 3 系列模子的推断预算则多达 3930 万 H100 GPU Hours—— 如斯推断量足可锻真金不怕火 DeepSeek-V3 至少 15 次。

而最近发布的 DeepSeek-R1 性能更猛 —— 在数学、代码、当然言语推理等任务上,它的性能并列 OpenAI o1 郑再版。何况模子在发布的同期,权重同步开源。许多东谈主惊呼,本来 DeepSeek 才是信得过的 OpenAI。UC Berkeley 教师 Alex Dimakis 则以为, DeepSeek 当今照旧处于跨越位置,好意思国公司可能需要蹈厉奋发了。

看到这里,咱们不难通晓为何 Meta 的团队会堕入焦炙。淌若本年推出的 Llama 4 莫得点硬式样,他们「开源之光」的地位岌岌可危。

有东谈主指出,其实该慌的不啻 Meta,OpenAI、谷歌、Anthropic 又何尝莫得受到挑战。「这是一件功德,咱们不错及时看到公开竞争对翻新的影响。」

还有东谈主系念起了英伟达的股价,暗意「淌若 DeeSeek 的翻新是真是,那 AI 公司是否真是需要那么多显卡?」

不外,也有东谈主质疑,DeepSeek 究竟是靠翻新如故靠蒸馏 OpenAI 的模子取胜?有东谈主回复说,这不错从他们的发布的时间论说中找到谜底。

当前,咱们还无法细目帖子的确切性。

不知谈 Meta 后续将如何回话,行将到来的 Llama 4 又会达到怎样的性能。



pc28



Powered by pc28 @2013-2022 RSS地图 HTML地图

Powered by站群系统