梁文锋,男, [3]1985年出生于广东省湛江市,浙江大学毕业,拥有信息与电子工程学系本科和硕士学位。杭州幻方科技有限公司、DeepSeek创始人。 [1-2] 2008年起,梁文锋开始带领团队使用机器学习等技术探索全自动量化交易。2015年,幻方量化正式成立。2019年,其资金管理规模突破百亿元;同年,梁文锋在当年的金牛奖颁奖仪式上发表主题演讲《一名程序员眼里中国量化投资的未来》。2020年开始,幻方的AI超级计算机“萤火一号”正式投入运作。2021年,幻方投入十亿建设“萤火二号”。2023年7月,幻方量化宣布成立大模型公司DeepSeek,正式进军通用人工智能领域。2024年5月,DeepSeek发布了DeepSeekV2;同年12月27日,DeepSeek-V3面世。2025年1月20日, DeepSeek正式发布DeepSeek-R1模型;同日,梁文锋参加了中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,并在会上发言。 [1-2] 中文名梁文锋 国 籍中国 出生日期1985年 [1] 毕业院校浙江大学 [1] 就职企业DeepSeek [2] 杭州幻方科技有限公司 [2] 主要成就DeepSeek创始人 [1-2] 性 别男 [3] 目录 1早年经历 2从业经历 3家庭关系 4主要贡献 5社会活动 早年经历 播报 编辑 1985年,梁文锋出生于广东省湛江市 [1-2],在广东一个五线城市长大。 [4]2002年,17岁的梁文锋考入浙江大学电子信息工程专业,属于电子工程系人工智能方向。 [1-2] [4] 在校期间,他对金融市场产生了浓厚的兴趣。特别在2008年全球金融危机之际,他带领团队探索了机器学习技术在全自动量化交易中的应用潜力。 [5] 本科毕业后,在浙大攻读硕士研究生,毕业论文题目是《基于低成本PTZ摄像机的目标跟踪算法研究》, [1-2] [4]2010年,获得信息与通信工程硕士学位。 [5] 从业经历 播报 编辑 2008年起,梁文锋开始带领团队使用机器学习等技术探索全自动量化交易。 [1-2]2013年,他与浙大同学徐进共同创立了杭州雅克比投资管理有限公司。 [5] 2015年,成立了杭州幻方科技有限公司,致力于通过数学和人工智能进行量化投资。当年的市场波动中,幻方依靠先进的高频量化策略取得了很好的成绩。 [2] [5] 2016年是幻方的重要转折点。 [5]10月21日,幻方量化推出第一个AI模型,实现了所有量化策略的AI化转型。到2017年底,几乎所有的量化策略都采用AI模型计算。 [4-5] 2018年,幻方正式确立了以AI为核心的发展战略。随着业务的快速扩展,算力瓶颈逐渐显现。 [5]2019年,梁文锋带领团队自主研发了“萤火一号”训练平台,总投资近2亿元,搭载了1100块GPU; [1]同年,梁文锋在当年的金牛奖颁奖仪式上发表主题演讲《一名程序员眼里中国量化投资的未来》 [2]。2020年开始,幻方累计投资超亿元、占地面积相当于一个篮球场的AI超级计算机“萤火一号”正式投入运作,号称可以匹敌4万台个人电脑的超级算力。 [2] 2021年,“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡; [2]幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”之列。 [1] 2023年5月,梁文锋宣布做通用人工智能(AGI)。7月,幻方量化宣布成立大模型公司DeepSeek,即杭州深度求索人工智能基础技术研究有限公司,正式进军通用人工智能领域。 [2] [4] 2024年5月,DeepSeek发布了DeepSeekV2。DeepSeek-V2的API定价为每百万tokens输入1元、输出2元,价格仅为GPT-4 Turbo的百分之一。 [2] [5]同年12月27日,DeepSeek-V3面世,并公布了长达53页的训练和技术细节。 [2] 2025年1月20日, DeepSeek正式发布DeepSeek-R1模型。 [1-2] 家庭关系 播报 编辑 父亲是小学老师。 [4] 主要贡献 播报 编辑 2019年,梁文锋带领团队自主研发了“萤火一号”训练平台,总投资近2亿元,搭载了1100块GPU。两年后,“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。 [1-2] 2021年,在梁文锋参与的论文中提到,他们正在部署的萤火二号系统,“配备了1万张A100GPU芯片”,在性能上接近DGX-A100(英伟达推出的人工智能专用超级计算机),但成本降低了一半,同时能耗减少了40%。 [2] 2021年,幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”之列。 [1-2] 2023年,他宣布将正式进军通用人工智能领域,并创办了深度求索DeepSeek,专注于做真正人类级别的人工智能。 2023年7月,幻方量化宣布成立大模型公司DeepSeek,正式进军通用人工智能领域。梁文锋为创始人。 [2] 2024年5月,DeepSeek发布混合专家语言模型DeepSeek-V2。同年12月,DeepSeek-V3问世,这款性能优越且性价比极高的大语言模型,被硅谷同行誉为“来自东方的神秘力量”。 [1] 社会活动 播报 编辑 2025年1月20日,梁文锋参加了中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,并在会上发言。 [1-2] 百度百科内容由网友共同编辑,如您发现自己的词条内容不准确或不完善,欢迎使用本人词条编辑服务(免费)参与修正。立即前往>> 词条图册更多图册 梁文锋 (1张) 参考资料 1DeepSeek创始人梁文锋参加总理座谈会,这家杭州公司藏不住了.钱江晚报 [引用日期2025-01-21] 2量化巨头幻方创始人梁文锋参加总理座谈会并发言,他还创办了“AI界拼多多”.澎湃新闻 [引用日期2025-01-23] 3“85后”广东小伙,缘何成为李强总理“座上宾”?.新浪财经 [引用日期2025-01-27] 4这家杭州科技公司创始人 为何成为总理的“座上宾”?.杭州网 [引用日期2025-01-27] 5DeepSeek创始人梁文锋参加总理座谈会,这家杭州科技公司有多厉害.钱江晚报 [引用日期2025-01-27]
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。 [4]注册地位于浙江省杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室,法定代表人为裴湉。 [7] DeepSeek的经营范围包括技术服务、技术开发;软件开发等。 [7]2024年1月5日,发布DeepSeek LLM,这是深度求索的第一个大模型。 [10]2024年1月25日,发布DeepSeek-Coder。 [10]2024年2月5日,发布DeepSeekMath。 [10]2024年3月11日,发布DeepSeek-VL。 [10]2024年5月7日,发布DeepSeek-V2。 [10]2024年6月17日,发布DeepSeek-Coder-V2。 [10]2024年9月5日,DeepSeek 官方更新 API 支持文档,宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat 两个模型,升级推出全新的 DeepSeek V2.5 新模型。 [8]2024年12月13日,发布用于高级多模态理解的专家混合视觉语言模型——DeepSeek-VL2。 [10]2024年12月26日晚,AI公司深度求索(DeepSeek)正式上线全新系列模型DeepSeek-V3首个版本并同步开源。 [1-2]12月30日,中信证券研报指出,DeepSeek-V3的正式发版引起AI业内广泛高度关注,其在保证了模型能力的前提下,训练效率和推理速度大幅提升。中信证券研报评价DeepSeek-V3,“DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普惠,助力AI应用广泛落地;同时训练效率大幅提升,亦将助力推理算力需求高增。我们持续看好AI产业链的加速落地机遇,建议重点关注AI应用、AI Infra、AI算力三大主线。”