中国在人工智能领域也跑得很快。中国的 DeepSeek 应用在龙8国际官方网站手机版和美国的苹果应用商店免费下载量都名列前茅,在美国超过了 ChatGPT。然而,中国这个鲜为人知的人工智能实验室却引发了硅谷的恐慌,因为它发布的人工智能模型尽管成本更低,使用的芯片功能更弱,却超过了美国最好的人工智能模型。 该实验室名为DeepSeek,它在12月底开发了一个免费开源的大型语言模型,并声称利用英伟达(Nvidia)的低容量芯片(H800),仅用了两个月时间和不到600万美元就建成了该模型。最新进展引起了人们的警觉,即美国在战略性人工智能领域的全球霸主地位正在缩小,这让人们对大型明星科技公司在创建人工智能模型和数据中心方面的巨额支出产生了质疑。 根据行业评估,在一系列第三方测试中,DeepSeek 的模型从解决复杂问题到数学和编码的准确性都优于 Meta 的 Llama 3.1、OpenAI 的 GPT-4o 和 Anthropic 的 Claude Sonnet 3.5。 上周,DeepSeek 发布了推理模型 r1,它在许多第三方测试中的表现甚至超过了 OpenAI 最新的 o1。人们对该实验室及其创始人梁文峰知之甚少。据媒体报道,DeepSeek 诞生于一家名为 High-Flyer Quant 的中国对冲基金,该基金管理着约 80 亿美元的资产。 但 DeepSeek 并不是唯一取得进展的中国公司。例如,初创公司 01,而 TikTok 的母公司 ByteDance 上周三发布了其模型的升级版,声称在一项关键基准测试中优于 OpenAI 的 o1。
版权所有 © Copyright ANSA