中共中央政治局常委、国务院总理李强1月20日下午主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。其中,“深度求索”(DeepSeek)公司创始人、“85后”广东小伙梁文锋的出席,刷屏科技圈。
梁文锋为何能够成为李强总理的“座上宾”?梁文锋所创立的“深度求索”(DeepSeek)公司究竟是什么来头?

深度求索(DeepSeek)创始人梁文锋。
撼动全球AI圈的“深度求索”(DeepSeek)
公开资料显示,梁文锋,1985年出生于广东省湛江市。17岁那年,他考入浙江大学电子信息工程专业,毕业后在浙大攻读硕士研究生。
2015年,梁文锋与朋友一同创办“幻方量化”,立志成为世界顶级的量化对冲基金。2016年10月,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行。到2017年底,几乎所有的量化策略都采用AI模型计算。
2023年7月,幻方量化宣布成立创新性大模型公司“深度求索”(DeepSeek),全称“杭州深度求索人工智能基础技术研究有限公司”,专注于AI大模型的研究和开发。据悉,“深度求索”(DeepSeek)包括创始人梁文锋在内,仅有139名工程师和研究人员。与此同时,OpenAI有1200名研究人员,Anthropic则有500多名研究人员。

创新性大模型公司深度求索(DeepSeek)。
去年5月,“深度求索”(DeepSeek)发布DeepSeek-V2,凭借创新的模型架构和史无前例的性价比,迅速出圈。DeepSeek-V2的关键开发者之一罗福莉曾在社交平台撰文表示,“单论DeepSeek-V2模型的中文水平,是真实处在国内外闭源模型的第一梯队”,“外加1元/百万输入Tokens的价格,只有GPT4价格的1/100,性价比之王”。顺带一提,此前传闻中小米创始人雷军曾开出千万元年薪希望挖走罗福莉,领导小米AI大模型团队。
而2024年12月26日,该公司宣布开源AI模型DeepSeek-V3的上线,更是引爆国内外AI圈、科技圈。
直新闻注意到,DeepSeek微信公众号发布的贴文寥寥,集中于招聘信息、大模型上线的消息。但值得注意的是,自2024年年底该公号推出名为“DeepSeek-V3 正式发布”的贴文后,多篇贴文的阅读量飙升至10万+。

DeepSeek公众号。
据DeepSeek推文显示,DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o(OpenAI大模型)以及Claude-3.5-Sonnet不分伯仲。令AI圈惊叹的是,DeepSeek-V3在性能上与顶尖的闭源大模型GPT-4o(OpenAI大模型)比肩的同时,全部训练成本总计仅为557.6万美元,甚至不到GPT-4o训练成本的二十分之一。

在多个基准测试中,DeepSeek-V3的性能与顶尖的闭源大模型GPT-4o不相上下。
此外,在性能上,DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o。
前Open AI联合创始人、Tesla AI团队负责人安德烈·卡帕西(Andrej Karpathy)在社交平台上发文称,DeepSeek-V3的出现也许意味着不需要大型GPU集群来训练前沿的大语言模型。他还表示,如果此模型还能通过各项评估,那么这将是资源受限条件下研究与工程能力的高度令人印象深刻的展示。

前Open AI 联合创始人、Tesla AI 团队负责人安德烈·卡帕西(Andrej Karpathy)在X上发文。
Scale AI创始人亚历山大·王(Alexander Wang)则发文称,DeepSeek-V3展示给外界苦涩的教训是:就在美国休息时,中国在工作,并以更便宜、更快、更强的产品迎头赶上。

亚历山大·王(Alexander Wang)在社交平台上的贴文。
为何“深度求索”(DeepSeek)受邀参与座谈会?
此次“深度求索”(DeepSeek)创始人梁文锋受邀出席李强总理主持召开的座谈会,足以看出中央与国家层面对于科技、人工智能(AI)产业的高度重视。
在座谈会上,李强总理提到,“要以科技创新推动新旧动能转换,集中力量突破关键核心技术和前沿技术,加快推进科技成果产业化,努力培育更多经济新增长点。”
值得注意的是,2024年,《政府工作报告》不仅3次提到“人工智能”,更首次提出了开展“人工智能+”行动。而过去的一年中,中国在人工智能领域发力明显,中央陆续出台一系列支持人工智能产业发展的政策。
1月20日,就在参加总理座谈会的当天,DeepSeek正式发布DeepSeek-R1模型。这款大模型在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
梁文锋此前接受采访时曾表示,回望过去30多年IT浪潮,中国基本没有参与到真正的技术创新里。被外界视为理想主义者的梁文锋称,“我们觉得现在最重要的是参与到全球创新的浪潮里去。”他说,“过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。”