本站的上一篇文章《健身记03 睡眠是健身的基础吗》是由DeepSeek全文生成,该模型行文流畅、数据详实,令人震撼。自2025年1月20日DeepSeek-R1发布以来,一周的时间内已经火遍全球,热度秒杀Kimi、豆包,比肩OpenAI/ChatGPT,还暴打了英伟达等一众美股的股价,让我们一起来探索DeepSeek究竟何许人也?
“出口转内销”
1月20日DeepSeek-R1发布,宣称“在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版”。时隔几日后,1月24日Arena榜单的发布(全称为:Chatbot Arena LLM Leaderboard),DeepSeek-R1榜上前三,其中在风格控制类模型(StyleCtrl)分类中与 OpenAI o1 并列第一。而其竞技场得分达到1357分,略超 OpenAI o1 的1352分。
1月24日,华尔街顶级风投A16Z创始人Marc Andreesen 在X上丝毫不吝惜自己的夸赞之词:
Deepseek R1 is one of the most amazing and impressive breakthroughs I’ve ever seen — and as open source, a profound gift to the world. 🤖🫡 DeepSeek R1是我见过的最令人惊叹,最令人印象深刻的突破之一,并且是开源的,是对全世界的大礼。
1月27日, 意犹未尽的Andreesen又说道:
Deepseek R1 is AI's Sputnik moment. Sputnik源自俄语,原意为苏联发射的第一颗人造地球卫星,这颗卫星开启了人类的太空时代,并引发苏美的太空竞赛。不得不说,Sputnik这个词用的非常恰当。
除了名人点评外,纽约时报等西方主流媒体也开始跟进报道。纽约时报的标题是《中国人工智能初创公司DeepSeek如何与硅谷巨头竞争》。主要内容是:
DeepSeek大模型以极低成本(600万美元)和少量芯片(2000块)实现了与OpenAI等巨头相媲美的性能,挑战了"唯有科技巨头才能研发尖端AI"的行业共识。其成功源于中国工程师在美国芯片限制下的创新突破:通过开源生态协作、算法优化及资源整合,将黑市芯片与量化交易公司的算力积累转化为技术优势。种模式不仅揭示美国技术封锁的意外反效果,更预示中国可能通过开源主导权重构全球AI竞争格局,使低成本创新成为颠覆行业的新路径。该报道称:“该公司构建了一个比谷歌和OpenAl等美国巨头更便宜、更具竞争力的聊天机器人,其高端计算机芯片数量更少,显示了芯片出口管制的局限性。”
英国金融时报等西方主流媒体都在1月24日大量报道DeepSeek,APP下载量也在APPLE STORE上榜。随后,国内的媒体才开始争相报道,小红书、微博等平台热度四起。1月26日,《黑神话:悟空》冯骥感叹:DeepSeek 可能是个国运级别的科技成果。也有网友将DeepSeek 比作AI界的黑神话。
正可谓是:技惊四座,惊艳老美,出口转内销。
杀手锏1:芯片需求小,棒打英伟达股价
英伟达是牛股中的牛股,前有比特币挖矿需求,后有AI算力需求,英伟达的显卡/芯片是AI的基石、是淘金潮的铲子,随着AI的爆发,英伟达的股价2024年初的50美金飙升到2025年初的150美金,涨幅200%。
DeepSeek-R1在1月24日技惊老美后,英伟达在当天(周五)股价下跌3%(正常波动),但是随着周末两天的发酵,美股周一开盘前英伟达盘前下跌13%。其中缘由,正是因为DeepSeek-R1用较少的芯片,就做出跟OpenAI同等水平的AI大模型,这让市场对AI芯片需求预期下降。
杀手锏2:开源、真正的OpenAI
无论是谷歌、Meta、微软/OpenAI,都有一个特点——闭源,即代码是私有的、不公开的。
OpenAI在2015年成立之初是一个非营利组织。其创始人包括Sutskever、现任首席执行官Sam Altman、总裁Greg Brockman以及现已离开OpenAI的马斯克。但现在的OpenAI已经蒙上商业外衣、背离初衷,变身ClosedAI。
而我们的DeepSeek-R1是名副其实开源的:
我们的开源仓库(包括模型权重)统一采用标准化、宽松的 MIT License,完全开源,不限制商用,无需申请。
产品协议明确可“模型蒸馏”。为了进一步促进技术的开源和共享,我们决定支持用户进行“模型蒸馏”。我们已更新线上产品的用户协议,明确允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。
这属实让OpenAI汗颜,让芯片管制、算力垄断、模型闭源的美国汗颜。
杀手锏3:我比你便宜
DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。
对比之下,OpenAI o1价格每百万输入 tokens 7.5美元(缓存命中)/ 15美元(缓存未命中),每百万输出 tokens 60美元。
没有对比,就没有伤害。
DeepSeek的起源:脱虚向实
2023年7月成立的DeepSeek确实如石猴一般横空出世;究其根源,其起源于幻方量化(2008年成立的私募管理公司),可谓是从金融行业脱胎换骨,投入实体经济的典范。
在R1之前,DeepSeek经过不到两年的迭代,在2024年12月26日上线的V3版本已经足够惊艳:DeepSeek-V3 仅用2048块GPU训练两个月,成本仅557万美元,不到Meta Llama 3的1/10,这无疑颠覆了行业认知。但DeepSeek仍是一家很小规模的年轻中国公司,由没有海外经历甚至没有资深从业经验的本土团队开发完成。
未完待续......