AI 圈的头条被 DeepSeek 承包了十几天,昨天,OpenAI 终于坐不住了,推出了全新推理模型系列 o3-mini。不仅首次向免费用户开放了推理模型,而且相比之前的 o1 系列,成本更是降低了 15 倍之多。 OpenAI 也称这是其推理模型系列中最新、最具成本效益的模型: 刚刚 ...
适用于常规 AI 模型和 MoE。 DeepSeek 的开源周已经进行到了第三天(前两天报道见文末「相关阅读」)。今天开源的项目名叫 DeepGEMM,是一款支持密集型和专家混合(MoE)GEMM 的 FP8 GEMM 库,为 V3/R1 的训练和推理提供了支持,在 Hopper GPU 上可以达到 1350+ FP8 TFLOPS 的 ...
整理|冬梅继 DeepSeek V4 Lite 信息泄露后,DeepSeek 团队刚刚放出重磅技术成果 —— 联合清华大学、北京大学计算机科学学院,发布一篇顶会级重磅论文《DualPath: Breaking the Storage ...
AI 圈的头条被 DeepSeek 承包了十几天,昨天,OpenAI 终于坐不住了,推出了全新推理模型系列 o3-mini。不仅首次向免费用户开放了推理模型,而且相比之前的 o1 系列,成本更是降低了 15 倍之多。 OpenAI 也称这是其推理模型系列中最新、最具成本效益的模型: ...
DeepSeek引发的冲击波仍在持续:不仅多个平台宣布接入DeepSeek,各个行业也密集搭上这趟“快车”。尽管DeepSeek通过优化算法显著降低算力需求,但因其高性价比助推AI普及,使得算力需求反而呈现指数级膨胀。对于国内算力产业而言,DeepSeek的创新带来了一个可以 ...
随着DeepSeek的大火,其背后的联网搜索支持方也受到关注。2025年世界移动通信大会期间,博查CTO翁柔莹接受每经记者专访时表示,DeepSeek爆火前已接入其搜索API。目前,博查Search API的日调用量已达3000万次,承接着国内AI应用60%的联网搜索请求。 每经记者|宋欣悦 ...
从横空出世引发西方毁誉冰火两重天,到面对网络攻击九州同袍共筑数字长城,这个春节假期,由深度探索(DeepSeek)所带来的震撼与惊喜,像新春的焰火般耀眼。在逆全球化浪潮涌动、科技博弈日趋白热化的今天,DeepSeek的这场突围给我们很多启示。 毋庸讳言 ...
作为当下大模型领域的“新晋顶流”,DeepSeek凭借其在开源免费商用授权、本地化部署能力等的独特优势,一经发布便火爆全网,在众多行业领域内掀起惊涛骇浪。教育行业也不例外,高校部署DeepSeek大模型已成为提升教学科研能力的重要举措。 目前,国内众多 ...
2025年伊始,DeepSeek的惊艳登场再次刷新了大众对AI技术的认知边界。随着其迅速走红,越来越多的AI芯片厂商纷纷宣布适配DeepSeek,展现出这一新兴技术的强大潜力和吸引力。作为一名电子工程师,您是否已经抢先完成了DeepSeek的本地部署?如果您还在摸索阶段 ...
使用微信扫码将网页分享到微信 「服务器繁忙,请稍后再试。」 一年前,我也是被这句话硬控的用户之一。 DeepSeek 带着 R1 在一年前的今天(2025.1.20)横空出世,一出场就吸引了全球的目光。 那时候为了能顺畅用上 DeepSeek,我翻遍了自部署教程,也下载过不少 ...
R1横空出世一年后,DeepSeek依然没有新融资。 在大模型玩家上市的上市、融资的融资的热闹中,DeepSeek还是那么高冷,并且几乎没有任何商业化的动作。 即便如此,AGI也没有落下—— 持续产出高水平论文,作者名单也相当稳定,新版R1论文甚至还「回流」了一位。
DeepSeek的成功使其创始人梁文锋引起了中国最高层的关注。上个月,他与一些民企高管一起与习近平会面。 Florence Lo/Reuters 自从中国的人工智能初创公司DeepSeek的创始人上个月与中国最高领导人习近平握手后,全国各地的官员都在争先恐后地展示他们是如何使用该 ...