国产大模型公司DeepSeek的应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,超越了ChatGPT。

这一成就不仅引起了市场的广泛关注,也对AI芯片龙头英伟达的股价产生了重大影响。尽管如此,英伟达发言人仍然对DeepSeek给出了高度评价,称其为AI领域的一项卓越进步,并指出DeepSeek的工作展示了如何利用测试时间缩放技术、广泛可用的模型以及符合出口管制的计算资源来创建新型号。

英伟达发言人补充道,推理过程需要大量英伟达GPU和高性能网络支持。英伟达目前掌握三种扩展规律:持续进行的预训练与后训练,以及新的测试时间缩放技术。这一表态也意味着DeepSeek使用的GPU完全符合美国的出口管制要求。

测试时间缩放技术是近年来备受讨论的一个话题,它指出如果一个已完成完整训练的AI模型在预测、生成文本或图像时投入更多计算资源帮助其推理,模型将输出更优质的答案。这一技术已被应用于OpenAI的o1等模型中。

1月27日,美股三大指数收盘涨跌不一,英伟达股价暴跌16.86%,收于每股118.58美元,跌至过去10个月以来的最低点。英伟达总市值2.90万亿美元,一日蒸发5900亿美元,创史上最大单日个股市值蒸发纪录。英伟达的暴跌也使得创始人黄仁勋的身家大幅缩水210亿美元。

在英伟达的带领下,美股半导体芯片板块集体受挫。DeepSeek系量化巨头幻方量化旗下大模型公司,1月20日正式发布推理大模型DeepSeek-R1。R1凭借其出色的性能、开源的性质、大幅下降的售价和训练成本获得了广泛关注。R1的预训练费用只有557.6万美元,在2048块英伟达H800GPU集群上运行55天完成。

划重点:

📈 DeepSeek应用登顶苹果中国和美国地区应用商店免费APP下载排行榜。

💬 英伟达评价DeepSeek为AI领域卓越进步,推理需要大量GPU。

💸 英伟达股价暴跌16.86%,一日蒸发5900亿美元,创史上最大单日个股市值蒸发纪录。