DeepSeek-V3悄然上线
昨夜,685B的DeepSeek-V3新版本悄悄上线。参数量685B的V3,代码数学推理显著提升,代码追平Claude 3.7。新模型版本为DeepSeek-V3-0324,参数量6850亿。从发布时间和技术特点看,它可能是DeepSeek-R2的基础架构,按照节奏,DeepSeek-R2可能几周后上线。DeepSeek-V3、DeepSeek-R2、代码数学推理
V3性能显著提升
升级后的V3在代码、数学推理能力上显著提升,在代码领域表现亮眼。相比上一版,从一个Python脚本就能看出V3代码性能改善,它还能解锁Claude 3.7 Sonnet很多玩法,代码可与之较量。DeepSeek V3采用MIT开源协议,可自由修改、分发模型。模型文件总计641GB,能在消费级设备上跑起来。DeepSeek-V3、代码性能、开源协议
网友实测好评如潮
已有机构、网友对V3展开测评。网友Xeophon自测,DeepSeek-V3-0324击败Claude 3.5 Sonnet。在代码能力上,它能与Claude 3.5 Sonnet一决高下。在Aider多语言基准测试中,DeepSeek-V3-0324成绩提升,仅次于Sonnet 3.7。网友实测它表现出色,能解决一些此前只有推理模型才能处理的提示。DeepSeek-V3、网友测评、代码能力
未来发展值得期待
DeepSeek-V3的突然上线,与过去模式吻合,业界传闻R2将在4月亮相,V3上线吹响了R2的前奏。先进开源推理模型影响大,若免费提供,高级AI系统将人人可用。DeepSeek-R2可能单挑GPT-5,打破OpenAI垄断。中美AI差异缩小,开源方式解决了中国公司特殊挑战,DeepSeek可能超越封闭系统。DeepSeek-V3、DeepSeek-R2、GPT-5
还没有评论,来说两句吧...