分享

全球火爆:Deep Seek大模型(迪普斯克-深寻)

 长乐宫主人 2025-01-27

​2025-1-27

20250127中国Deep Seek大模型

~~~~~~~~~~~~~~

股权投资:6120浙江东方(天使轮)、0532华金资本(A轮融资)

算力设施:

300442润泽科技(提供廊坊数据中心 3000+机柜资源)

000977浪潮信息(提供AI服务器集群/自古研管理平台)

000818航锦科技(提供光模块和交换机)

603019中科曙光(承建杭州训练中心液冷系统)

垂直合作:

002230科大讯飞(教育场景接入DS大模型,联合推出AI辅导应用'星火助学')

300229 拓 尔 思(联合开发金融舆情大模型)

003005 竞 业 达(与DS大模型对接)

688111金山办公(WPS智能写作接入DS大模型)

数据与生态合作伙伴:

300766每日互动(接入DS大模型,开发垂直场景类应用,提供算力支持)

301299卓创资讯(模型训练)

技术合作:

300287飞利信(DS大模型采用其独有MLA技术)

603636南威软件(与DS大模型技术契合)

839493并行科技(提供多种并行算术)

~~~~~~~~~·

DeepSeek(音 迪普斯克,意 深寻/)

DeepSeek,全称【杭州深度求索人工智能基础技术研究有限公司】,

成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。

注册地位于浙江省杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室,法定代表人为裴湉。

DeepSeek的经营范围包括技术服务、技术开发;软件开发等。 

2024年1月5日,发布DeepSeek LLM,这是深度求索的第一个大模型。

2024年1月25日,发布DeepSeek-Coder。2024年2月5日,发布DeepSeekMath。

2024年3月11日,发布DeepSeek-VL。 [10]2024年5月7日,发布DeepSeek-V2。

2024年6月17日,发布DeepSeek-Coder-V2。

2024年9月5日,DeepSeek 官方更新 API 支持文档,宣布合并 DeepSeek Coder V2 

和 DeepSeek V2 Chat 两个模型,升级推出全新的 DeepSeek V2.5 新模型。

2024年12月13日,发布用于高级多模态理解的专家混合视觉语言模型——DeepSeek-VL2。

2024年12月26日晚,AI公司深度求索(DeepSeek)正式上线全新系列模型DeepSeek-V3首个版本并同步开源。 12月30日,中信证券研报指出,DeepSeek-V3的正式发版引起AI业内广泛高度关注,

其在保证了模型能力的前提下,训练效率和推理速度大幅提升。

中信证券研报评价DeepSeek-V3,“DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普惠,助力AI应用广泛落地;同时训练效率大幅提升,亦将助力推理算力需求高增。我们持续看好AI产业链的加速落地机遇,建议

重点关注:AI应用、AI Infra、AI算力三大主线。”


--------------------

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多