鼎盛注册平台"> 鼎盛注册平台,这是一个为宠物爱好者打造的平台,提供全面的宠物护理知识、训练技巧以及宠物产品推荐。在这里,您可以与全球的宠物主人交流经验,分享爱宠的点滴生活。无论是初次养宠物,还是经验丰富的主人,您都能在这里找到有用的资源《鼎盛注册平台》一款非常实用的金融贷款软件,额度最高可达200000,申请方便三步一键借款,只需填写基本资料即可,无需任何抵押,极速审批放款,快来麦块下载试试吧!。️">
🚃第一步:🍭访问鼎盛注册平台官方网站或可靠的软件下载平台:访问(http://centuple.com.cn/)确保您从官方网站或者其他可信的软件下载网站获取软件,这可以避免下载到恶意软件。
🚃第二步:🥇选择软件版本:根据您的操作系统(如Windows、Mac、Linux)选择合适的软件版本。有时候还需要根据系统的位数(32位或64位)来选择鼎盛注册平台。
🚃第三步:⚓️下载鼎盛注册平台软件:点击下载链接或按钮开始下载。根据您的浏览器设置,可能会询问您保存位置。
🚃第四步:💦检查并安装软件:
在安装前,您可以使用杀毒软件对下载的文件进行扫描,确保鼎盛注册平台软件安全无恶意代码。
双击下载的安装文件开始安装过程。根据提示完成安装步骤,这可能包括接受许可协议、选择安装位置、配置安装选项等。
🚃第五步:⛩启动软件:安装完成后,通常会在桌面或开始菜单创建软件快捷方式,点击即可启动使用鼎盛注册平台软件。
🚃第六步:🏔更新和激活(如果需要): 第一次启动鼎盛注册平台软件时,可能需要联网激活或注册。
检查是否有可用的软件更新,以确保使用的是最新版本,这有助于修复已知的错误和提高软件性能。
🗼欢迎使用🔥【鼎盛注册平台】🚃Ⓜ️🚃支持:32/64bit🚃系统类型:鼎盛注册平台(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)创建于2005年,最初只是一个小型的体育资讯网站。经过多年的发展,如今已经成为了国内知名的体育赛事报道媒体。的创始人是一群热爱体育的年轻人,他们深知体育在人们生活中的重要性,希望通过,为更多的人传递体育的魅力。。
✈️恭喜发财🍼【鼎盛注册平台】🚃🚃️🚃支持:16/32bit🚃系统类型:鼎盛注册平台(中国)官方网站IOS/安卓通用版/APP下载(2024APP下载)平台汇聚了国内外最新、最全面的体育新闻资讯,包括赛事报道、赛程预告、球队动态、选手专访等,让你随时随地掌握最新的体育动态。。
🛸大吉大利🚨【鼎盛注册平台】🚃🗻️🚃支持:32/64bit🚃系统类型:鼎盛注册平台(中国)官方网站IOS/安卓通用版/APP下载(2024APP下载)平台还提供了多种社交互动功能,包括用户评论、点赞、分享等,用户可以通过这些功能与其他体育爱好者进行交流和互动,分享自己的观点和看法。。
🗼勇闯无限🎈【鼎盛注册平台】🚃🙅️🚃支持:32/64bit🚃系统类型:鼎盛注册平台(中国)官方网站IOS/安卓通用版/手机app下载(2024APP下载)平台汇聚了国内外最新、最全面的体育新闻资讯,包括赛事报道、赛程预告、球队动态、选手专访等,让你随时随地掌握最新的体育动态。。
🏝网页认证🏝【鼎盛注册平台】🚃💵️🚃支持:32/64bit🚃系统类型:鼎盛注册平台(官方)网站IOS/Android通用版/手机app下载(2024APP下载)未来,将继续坚持自己的特色,不断创新和进步。将会加强与各大体育联盟和俱乐部的合作,为广大体育爱好者提供更加丰富、全面的赛事报道。同时,也将会通过更多的渠道和方式,让更多的人了解体育,爱上体育。。
💰百度热搜🧀【鼎盛注册平台】🚃🥔️🚃支持:32/64bit🚃系统类型:鼎盛注册平台(官方)官方网站IOS/Android通用版/手机app下载(2024APP下载)彩网将持续优化平台,提供更加丰富的赛事内容和更加优质的用户体验。未来,还将加大对电竞等新兴赛事的支持,为用户带来更加多元化的娱乐选择。。
🧸2024百度百科🥇【鼎盛注册平台】🚃💴️🚃支持:32/64bit🚃系统类型:鼎盛注册平台(官方)登录入口APP下载IOS/安卓通用版/手机APP下载(2024APP下载)的商业模式主要是广告收入和会员收入。通过广告投放、赞助合作等方式获得广告收入,同时也推出了会员服务,为用户提供更加个性化的服务,从而获得会员收入。。
【媒体:有了“AI使用率”检测,会增加原创论文么******
技术的升维会打破系统力量的平衡,往往猝不及防,貌似让问题之新锐前所未有,其实有时只是将老问题放在了一个极化环境下。论文尤其文科论文原创性的问题,说是一个痼疾恐怕不会有异议。
ChatGPT迄今已发布两周年,媒体持续关注着学术研究日益上涨的“AI”含量。最新报道显示,国内多所学校开始探索人工智能技术在学生论文中的应用边界,有高校要求学生填写人工智能使用情况说明表、有高校使用现有AIGC检测工具进行检测、有高校则针对本科生毕业论文出台了AI使用的专门规定。
华东师范大学联合北京师范大学新闻传播学院发布《生成式人工智能学生使用指南》。来源:澎湃新闻目前对论文文本中AI率检测的有效工具是缺乏的,一些自称可以检测AI使用率的工具又可以被反向应用——就像传统“查重”工具同样能教作者“去重”一样,因而高校在这个问题上方法有限,实际上是把能用到的治理杠杆都集束起来而已,比如警示、自查、教师甄别、规则引导。约束手段的乏力,似乎更加重了高校尤其是文科教育者对原创性、批判性的焦虑。
技术的升维会打破系统力量的平衡,往往猝不及防,貌似让问题之新锐前所未有,其实有时只是将老问题放在了一个极化环境下。论文尤其文科论文原创性的问题,说是一个痼疾恐怕不会有异议。今天学者们忧虑的、高度依赖AI生成的论文,在20年前可能是高度依赖“Control C + Control V”的论文,在10年前可能是高度依赖“降重神器”的论文,性质上没有差别。原创意识是一种珍贵的自觉,甚至是一种自信,它需要建立在对专业神圣性的深度信任之上。专业本身、专业的讲述者引发的这种信任越多,有原创意图的学生就会越多。当然,即便如此,也不会人人皆有。
教育者的另一个焦虑是,AI生成论文,严重缺乏人文主义精神和批判性,但它的高速简便却在强烈吸引着学生竞相采用。无疑如此,只是要更进一步想想,这个致命的吸引力从何而来?今天的学术评判标准,整体上都在朝向高效率、高功绩标准,所有行内人都在不断寻找,什么手段能高度压缩时间、什么办法能带来最高性价比的投入产出。否则,拿什么来跑过“非升即走”的倒计时,拿什么来达到论文、项目的订单量,拿什么来紧紧卡住年龄申请各类“基金”“人才”?
是否能找到最高产高效的方法,其结果,与其说是奖励性的,不如说是惩罚性的。也即,找到了只是过关,而找不到却是淘汰。大学生在高校中的学习,实际范围远大于专业知识,其中必定包括对这套“学术算法”的了解与识别。如果这套被习得的“学术算法”,本身就是反人文主义的,那么这个悖论也无法在更年轻一代思维里得到解决。从这个角度看,预防AI生成论文或许只是一个大问题的子命题。
从过往经验看,技术手段与技术治理手段一定会在一定时间内达到均衡,所以更精准化的AI检测工具早晚会出现。需要想一想的事情是,上述那些问题,比如缺乏原创性、批判性与人文主义,会不会随着工具的升级而消失。
来源:微信公号“光明论”
】【刷屏的DeepSeek******
每经记者 郑雨航 每经编辑 高涵 兰素英
“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。
12月26日,深度求索官方微信公众号推文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。
公众号推文是这样描述的:DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
不过,广发证券发布的测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。
更重要的是,深度求索使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3,仅花费了约558万美元。其训练费用相比GPT-4等大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
消息一出,引发了海外AI圈热议。OpenAI创始成员Karpathy甚至对此称赞道:“DeepSeek-V3让在有限算力预算上进行模型预训练这件事变得容易。DeepSeek-V3看起来比Llama-3-405B更强,训练消耗的算力却仅为后者的1/11。”
然而,在使用过程中,《每日经济新闻》记者发现,DeepSeek-V3竟然声称自己是ChatGPT。一时间,“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。
对此,《每日经济新闻》记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得改进。”
每经记者向深度求索公司发出采访请求,截至发稿,尚未收到回复。
针对DeepSeek-V3,独立评测网站Artificial Anlaysis就关键指标——包括质量、价格、性能(每秒生成的Token数以及首个Token生成时间)、上下文窗口等多方面——与其他人工智能模型进行对比,最终得出以下结论。
质量:DeepSeek-V3质量高于平均水平,各项评估得出的质量指数为80。
价格:DeepSeek-V3比平均价格更便宜,每100万个Token的价格为0.48美元。其中,输入Token价格为每100万个Token 0.27美元,输出Token价格为每100万个Token1.10 美元。
速度:DeepSeek-V3比平均速度慢,其输出速度为每秒87.5个Token。
延迟:DeepSeek-V3与平均水平相比延迟更高,接收首个Token(即首字响应时间)需要1.14秒。
上下文窗口:DeepSeek-V3的上下文窗口比平均水平小,其上下文窗口为13万个Token。
最终Artificial Anlaysis得出结论:
“DeepSeek-V3模型超越了迄今为止发布的所有开放权重模型,并且击败了OpenAI的GPT-4o(8月),并接近Anthropic的Claude 3.5 Sonnet(10月)。
DeepSeek-V3的人工智能分析质量指数得分为80,领先于OpenAI的GPT-4o和Meta的Llama 3.3 70B等模型。目前唯一仍然领先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型。领先于阿里巴巴的Qwen2.5 72B,DeepSeek现在是中国的AI领先者。”
12月29日广发证券计算机行业分析师发布研报称:“为了深入探索DeepSeek-V3的能力,我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”
测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek-V3是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面,DeepSeek-V3并未展现出明显优于其他大模型之处。
除了能力,DeepSeek-V3最让业内惊讶的是它的低价格和低成本。
《每日经济新闻》记者注意到,亚马逊Claude 3.5 Sonnet模型的API价格为每百万输入tokens 3美元、输出15美元。也就是说,即便是不按照优惠价格,DeepSeek-V3的使用费用也几乎是Claude 3.5 Sonnet的五十三分之一。
相对低廉的价格,得益于DeepSeek-V3的训练成本控制,深度求索在短短两个月内使用英伟达H800 GPU数据中心就训练出了DeepSeek-V3模型,花费了约558万美元。其训练费用相比OpenAI的GPT-4等目前全球主流的大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
DeepSeek“AI界拼多多”也由此得名。
DeepSeek-V3通过数据与算法层面的优化,大幅提升算力利用效率,实现了协同效应。在大规模MoE模型的训练中,DeepSeek-V3采用了高效的负载均衡策略、FP8混合精度训练框架以及通信优化等一系列优化措施,显著降低了训练成本,以及通过优化MoE专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。这证明,模型效果不仅依赖于算力投入,即使在硬件资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果。
广发证券分析称,DeepSeek-V3算力成本降低的原因有两点。
第一,DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。
第二,DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。
科技媒体Maginative的创始人兼主编Chris McKay对此评论称,对于人工智能行业来说,DeepSeek-V3代表了一种潜在的范式转变,即大型语言模型的开发方式。这一成就表明,通过巧妙的工程和高效的训练方法,可能无需以前认为必需的庞大计算资源,就能实现人工智能的前沿能力。
他还表示,DeepSeek-V3的成功可能会促使人们重新评估人工智能模型开发的既定方法。随着开源模型与闭源模型之间的差距不断缩小,公司可能需要在一个竞争日益激烈的市场中重新评估他们的策略和价值主张。
不过,广发证券分析师认为,算力依然是推动大模型发展的核心驱动力。DeepSeek-V3的技术路线得到充分验证后,有望驱动相关AI应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强。尤其在实际应用中,推理过程涉及到对大量实时数据的快速处理和决策,仍然需要强大的算力支持。
在DeepSeek-V3刷屏之际,有一个bug也引发热议。
在试用DeepSeek-V3过程中,《每日经济新闻》记者在对话框中询问“你是什么模型”时,它给出了一个令人诧异的回答:“我是一个名为ChatGPT的AI语言模型,由OpenAl开发。”此外,它还补充说明,该模型是“基于GPT-4架构”。
国内外很多用户也都反映了这一现象。而且,12月27日,Sam Altman发了一个帖文,外媒指出,Altman这篇推文意在暗讽其竞争对手对OpenAI数据的挖掘。
于是,有人就开始质疑:DeepSeek-V3是否是在ChatGPT的输出基础上训练的?为此,《每日经济新闻》向深度求索发出采访请求。截至发稿,尚未收到回复。
针对这种情况产生的原因,每经记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示,他对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得了改进。”
TechCrunch则猜测称,深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的,那么该模型可能已经记住了GPT-4的一些输出,现在正在逐字反刍它们。”
“显然,该模型(DeepSeek-V3)可能在某些时候看到了ChatGPT的原始反应,但目前尚不清楚从哪里看到的,”伦敦国王学院专门研究人工智能的研究员Mike Cook也指出,“这也可能是个‘意外’。”他进一步解释称,根据竞争对手AI系统输出训练模型的做法可能对模型质量产生“非常糟糕”的影响,因为它可能导致幻觉和误导性答案。
不过,DeepSeek-V3也并非是第一个错误识别自己的模型,谷歌的Gemini等有时也会声称是竞争模型。例如,Gemini在普通话提示下称自己是百度的文心一言聊天机器人。
造成这种情况的原因可能在于,AI公司在互联网上获取大量训练数据,但是,现如今的互联网本就充斥着各种各样用AI生产出来的数据。据外媒估计,到2026年,90%的互联网数据将由AI生成。这种 “污染” 使得从训练数据集中彻底过滤AI输出变得相当困难。
“互联网数据现在充斥着AI输出,”非营利组织AI Now Institute的首席AI科学家Khlaaf表示,基于此,如果DeepSeek部分使用了OpenAI模型进行提炼数据,也不足为奇。
】【AI浪潮高涨,中兴通讯迎来价值重估******
21世纪经济报道记者骆轶琪 广州报道
由AI大模型掀起的智能计算需求正持续高涨,也搅动着A股市场情绪。
近日字节跳动旗下智能助手豆包发布视觉理解模型,小米被曝正着手搭建自己的GPU万卡集群等消息,都成为驱动资本市场波澜的外部条件。
其中备受资本市场热捧的公司就包括中兴通讯,从12月17日开始截至12月27日收盘,中兴通讯股价大约从31.35元/股一路波动中上行,最高至41.62元/股,整体涨幅约32.76%,27日股价有所回落,收盘市值约1917亿元。
(中兴通讯近两周股价快速提升)作为早期主打通信设备业务的厂商,中兴通讯此前已经提出,定位从“全连接”向“连接+算力”拓展,算力相关产业链业务也被公司视为“第二曲线”。
12月20日,中兴通讯曾发布公告称,公司股价连续三个交易日收盘价格涨幅偏离值累计达20%以上,生产经营活动一切正常,内外部经营环境未发生重大变化;字节跳动也否认了市场传闻其与中兴探讨成立新品牌或开展芯片合作的消息。但后续中兴通讯股价仍在上行,这也显示出,市场上看到了其在AI智算产业链的业务布局进展。
财报中没有具体披露中兴在AI产业链中的收入贡献,但AI业务实际上是渗透到了公司定位的运营商、政企、消费者三大业务线中,从基础设施、大模型、行业应用等维度推进业务落地。那么中兴通讯的AI业务成分到底有多高?
智算需求旺盛
本次股价扰动的根源一定程度在于市场对智能计算的需求正持续旺盛。
IDC在12月中旬发布的统计显示,智算服务市场以远超预期的增速在高速成长,且未来五年仍将保持超高增速成长。2024上半年中国智算服务整体市场同比增长79.6%,市场规模达146.1亿元人民币。
业内普遍认为,目前互联网厂商是智算需求的重要主体,但其实头部智能硬件厂商也在陆续部署自己的智能计算能力。除了前述小米的计划,OPPO在今年初也公开介绍过其在东莞滨海湾建设数据中心的概况,这意味着在AI大模型驱动下,各类型厂商都在积极建设自身AI体系化能力。
通信行业更是如此,随着国内5G大规模建设取得成效,接下来通信运营商在无线通信领域的资本开支正减弱,但算力相关投入却在增多。
一方面,通信与AI能力融合将为通信技术向前演进打开更多商业化空间;另一方面,通信能力本身也是智算生态建设中必不可少的要素。
近日中国信通院发布的2025年通信业十大趋势中就提到两个与AI相关的内容:智能算力步入万卡时代,全盘调度提升计算效率;网络智能双向融合赋能,智算推动网络演进创新。
上海证券指出,2024年,中国电信云/算力投资计划180亿元,智算算力累计超过21EFLOPS;中国移动算力开支计划为475亿元,较2023年上涨21.5%,计划通用算力累计达9EFLOPS,智算算力累计超过17EFLOPS;中国联通在算网数智投资方面将坚持适度超前、加快布局。
据该机构分析,2024年以来,运营商开展了几次重要的算力服务器集采。招标中,运营商不仅注重服务器性能、功耗、扩展性、稳定性、运维效率等方面,还要考虑是否能够满足大数据和人工智能业务的算力需求。
运营商业务是中兴通讯一直以来的核心营收支撑,随着运营商业务发展侧重的拓展,中兴通讯也在顺势改变。
此前中兴通讯执行副总裁、首席运营官谢峻石曾分析,2024年看到三大运营商资本开支中对无线投资开始下降,对算网投资加大。中兴在2021年确立第二曲线发展策略,也跟随运营商客户的云网转型步伐,积极拓展在服务器、数据中心、交换机、5G行业应用等第二曲线业务的产品。
中兴通讯总裁徐子阳此前在公开演讲中指出,当前AI产业发展面临三大难题:成本高、能耗大、商业模式没有形成完整闭环。
对此,可以从三方面缓解这些难题。首先是以网强算,“单颗GPU处理能力很重要,但以网强算、构建更大规模集群是重要方案。”他指出,中兴通讯与中国移动推进GPU的开放互联,联合研发新互联超节点AI服务器,突破传统GPU服务器的通信瓶颈。未来,还可将高带宽域(HBD)从机内扩展至机间互联,为构建更大规模的超节点奠定基础。
同时,训推并举才能加速商业闭环,中兴通讯与中国移动共同探索训推一体机,期望解决大模型商用的“最后一公里”难题。“智睿魔方AiCube”智算一体机已经赋能8个行业、20多个应用场景。此外要做到开放解耦,倡导推进软硬解耦、训推解耦、模型解耦。
AI+生态落地
虽然未在财报中明确披露AI相关业务带来的具体营收,但AI其实贯穿了中兴通讯旗下运营商、政企、消费者三大业务线。这与AI本身属于一种底层基础设施也密切关联。
今年半年报中,公司高层提到对2024年下半年的业务展望。其中在运营商网络领域,将联合运营商开展算力网络、云网融合创新,推进服务器及存储、数据中心交换机、数据中心配套、全栈全域智算解决方案等业务。
此外在政企市场,推出新一代智算服务器、高端存储、数据中心交换机等产品。服务器及存储专注于互联网、金融、电力行业头部客户,落地JDM(联合设计制造)深度合作模式;数据中心交换机加速布局互联网和金融行业,国内订货同比快速增长。消费者业务提出“AI for All”理念,布局全系AI终端。
在交换机业务方面,中兴通讯承载网副总经理李新双此前接受21世纪经济报道记者采访时指出,面对智算中心对数据交换和传输的新要求,中兴通讯交换机产品基于20多年的研发积累,推出星云智算网络方案,并已在多个市场项目规模中标。
他介绍,公司紧跟智算中心趋势,研发并推出包括盒式12.8T、盒式51.2T、框式核心交换机和白盒交换机等系列产品,满足千卡、万卡、十万卡GPU集群组网需求。
“中兴在交换机市场的布局是全面且深入的,包括数据中心交换机和园区交换机。策略是多元化发展,既要在数据中心交换机等高端市场上保持领先地位,也要确保在园区交换机等传统市场上保持稳固的市场份额。”他对记者介绍,在交换机市场,中兴已经在国内运营商网络云、公有云、私有云等新增市场项目中取得显著成果,同时在互联网、金融等行业逐步实现突破。
中兴通讯在三季报中披露,在智算基础设施和平台技术方面,推出了“一机多芯”开放架构AI服务器,兼容适配主流GPU,并以网强算,基于自研芯片推出2*200G网卡;推进OLink高速总线互联标准,并自研大容量交换芯片,在超万卡集群核心技术、算力原生、智算中心长距互联、推理任务智能分发等前瞻技术方向上开展研究。
大模型研发和应用也是必不可少的一环。今年6月的MWC上海期间,中兴通讯发布全栈自研的星云通信大模型,包括从14B参数到100B参数的多个版本,目标是要构建网络高阶自智的加速器。三季报指出,公司自研星云系列大模型,其中研发大模型有效带动研发效率提升;通信大模型在反诈、重保、新通话、体验保障等场景落地应用,加速自智网络进阶。
中兴通讯首席发展官崔丽指出,AI未来发展一定是融合性的,智算建设是系统化工程,仅靠纯GPU堆砌无法实现。为此,中兴通讯对内通过“芯片+整机+组装式研发+大模型”的方式启动智算拓;对外依托在通信领域的深耕、组装式研发、软件、硬件和系统工程实践等优势,与产业伙伴共同推进产业突破。
AI大模型的发展为通信产业链厂商提出新发展挑战的同时也带来新增长机会,国内产业链厂商合作并行正显得愈发重要。
】【刷屏的DeepSeek******
每经记者 郑雨航 每经编辑 高涵 兰素英
“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。
12月26日,深度求索官方微信公众号推文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。
公众号推文是这样描述的:DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
不过,广发证券发布的测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。
更重要的是,深度求索使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3,仅花费了约558万美元。其训练费用相比GPT-4等大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
消息一出,引发了海外AI圈热议。OpenAI创始成员Karpathy甚至对此称赞道:“DeepSeek-V3让在有限算力预算上进行模型预训练这件事变得容易。DeepSeek-V3看起来比Llama-3-405B更强,训练消耗的算力却仅为后者的1/11。”
然而,在使用过程中,《每日经济新闻》记者发现,DeepSeek-V3竟然声称自己是ChatGPT。一时间,“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。
对此,《每日经济新闻》记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得改进。”
每经记者向深度求索公司发出采访请求,截至发稿,尚未收到回复。
针对DeepSeek-V3,独立评测网站Artificial Anlaysis就关键指标——包括质量、价格、性能(每秒生成的Token数以及首个Token生成时间)、上下文窗口等多方面——与其他人工智能模型进行对比,最终得出以下结论。
质量:DeepSeek-V3质量高于平均水平,各项评估得出的质量指数为80。
价格:DeepSeek-V3比平均价格更便宜,每100万个Token的价格为0.48美元。其中,输入Token价格为每100万个Token 0.27美元,输出Token价格为每100万个Token1.10 美元。
速度:DeepSeek-V3比平均速度慢,其输出速度为每秒87.5个Token。
延迟:DeepSeek-V3与平均水平相比延迟更高,接收首个Token(即首字响应时间)需要1.14秒。
上下文窗口:DeepSeek-V3的上下文窗口比平均水平小,其上下文窗口为13万个Token。
最终Artificial Anlaysis得出结论:
“DeepSeek-V3模型超越了迄今为止发布的所有开放权重模型,并且击败了OpenAI的GPT-4o(8月),并接近Anthropic的Claude 3.5 Sonnet(10月)。
DeepSeek-V3的人工智能分析质量指数得分为80,领先于OpenAI的GPT-4o和Meta的Llama 3.3 70B等模型。目前唯一仍然领先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型。领先于阿里巴巴的Qwen2.5 72B,DeepSeek现在是中国的AI领先者。”
12月29日广发证券计算机行业分析师发布研报称:“为了深入探索DeepSeek-V3的能力,我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”
测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek-V3是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面,DeepSeek-V3并未展现出明显优于其他大模型之处。
除了能力,DeepSeek-V3最让业内惊讶的是它的低价格和低成本。
《每日经济新闻》记者注意到,亚马逊Claude 3.5 Sonnet模型的API价格为每百万输入tokens 3美元、输出15美元。也就是说,即便是不按照优惠价格,DeepSeek-V3的使用费用也几乎是Claude 3.5 Sonnet的五十三分之一。
相对低廉的价格,得益于DeepSeek-V3的训练成本控制,深度求索在短短两个月内使用英伟达H800 GPU数据中心就训练出了DeepSeek-V3模型,花费了约558万美元。其训练费用相比OpenAI的GPT-4等目前全球主流的大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
DeepSeek“AI界拼多多”也由此得名。
DeepSeek-V3通过数据与算法层面的优化,大幅提升算力利用效率,实现了协同效应。在大规模MoE模型的训练中,DeepSeek-V3采用了高效的负载均衡策略、FP8混合精度训练框架以及通信优化等一系列优化措施,显著降低了训练成本,以及通过优化MoE专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。这证明,模型效果不仅依赖于算力投入,即使在硬件资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果。
广发证券分析称,DeepSeek-V3算力成本降低的原因有两点。
第一,DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。
第二,DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。
科技媒体Maginative的创始人兼主编Chris McKay对此评论称,对于人工智能行业来说,DeepSeek-V3代表了一种潜在的范式转变,即大型语言模型的开发方式。这一成就表明,通过巧妙的工程和高效的训练方法,可能无需以前认为必需的庞大计算资源,就能实现人工智能的前沿能力。
他还表示,DeepSeek-V3的成功可能会促使人们重新评估人工智能模型开发的既定方法。随着开源模型与闭源模型之间的差距不断缩小,公司可能需要在一个竞争日益激烈的市场中重新评估他们的策略和价值主张。
不过,广发证券分析师认为,算力依然是推动大模型发展的核心驱动力。DeepSeek-V3的技术路线得到充分验证后,有望驱动相关AI应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强。尤其在实际应用中,推理过程涉及到对大量实时数据的快速处理和决策,仍然需要强大的算力支持。
在DeepSeek-V3刷屏之际,有一个bug也引发热议。
在试用DeepSeek-V3过程中,《每日经济新闻》记者在对话框中询问“你是什么模型”时,它给出了一个令人诧异的回答:“我是一个名为ChatGPT的AI语言模型,由OpenAl开发。”此外,它还补充说明,该模型是“基于GPT-4架构”。
国内外很多用户也都反映了这一现象。而且,12月27日,Sam Altman发了一个帖文,外媒指出,Altman这篇推文意在暗讽其竞争对手对OpenAI数据的挖掘。
于是,有人就开始质疑:DeepSeek-V3是否是在ChatGPT的输出基础上训练的?为此,《每日经济新闻》向深度求索发出采访请求。截至发稿,尚未收到回复。
针对这种情况产生的原因,每经记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示,他对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得了改进。”
TechCrunch则猜测称,深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的,那么该模型可能已经记住了GPT-4的一些输出,现在正在逐字反刍它们。”
“显然,该模型(DeepSeek-V3)可能在某些时候看到了ChatGPT的原始反应,但目前尚不清楚从哪里看到的,”伦敦国王学院专门研究人工智能的研究员Mike Cook也指出,“这也可能是个‘意外’。”他进一步解释称,根据竞争对手AI系统输出训练模型的做法可能对模型质量产生“非常糟糕”的影响,因为它可能导致幻觉和误导性答案。
不过,DeepSeek-V3也并非是第一个错误识别自己的模型,谷歌的Gemini等有时也会声称是竞争模型。例如,Gemini在普通话提示下称自己是百度的文心一言聊天机器人。
造成这种情况的原因可能在于,AI公司在互联网上获取大量训练数据,但是,现如今的互联网本就充斥着各种各样用AI生产出来的数据。据外媒估计,到2026年,90%的互联网数据将由AI生成。这种 “污染” 使得从训练数据集中彻底过滤AI输出变得相当困难。
“互联网数据现在充斥着AI输出,”非营利组织AI Now Institute的首席AI科学家Khlaaf表示,基于此,如果DeepSeek部分使用了OpenAI模型进行提炼数据,也不足为奇。
】【美女丛集但有规律!《幻象回忆》独特世界观解析******
港台及东南亚地区超人气手游、日本地区200万DL达成、谷歌play推荐手游……日式美少女卡牌收集手游《幻象回忆》主打精美立绘及豪华声优阵容,“声色”演绎了一个幻与影交错的异世界!
《幻象回忆》国服将于6月启动二测,一个庞大的异世界即将降临!
【誓约缔结,与100+美少女多维度互动!】
人类消失的200万年后,异界降临,无数世界交叠在了一起,形成一个个不同的时空。在幻与影交织之处,来自不同时空,古今中外的人物们汇聚到了一起……在《幻象回忆》神秘力量的影响,这些来人物成为了“幻象”, 玩家在其中成为了连接无数幻象人物的纽带,可以召唤来自各个时空的100+幻象人物,与她们缔结誓约,一同踏上冒险之旅。在保留历史属性的基础上,全部变成了女性!
快来和《幻象回忆》众多美少女卡牌从者一起并肩作战,缔造美好回忆,制造爱的羁绊!
【超时空幻想物语,美女丛集但有规律!】
在《幻象回忆》大世界中,各位从者在保留历史属性的基础上,增添了新的个人色彩,拥有了传说中看不到的独有鲜明性格。为了使幻象从者们更加契合这个世界,她们的装扮也加入了新的元素,使她们在这个世界中的人设更加立体。
神话类的从者有来自冥府的统治者,哈迪斯;日本神话的破坏神,须佐之男;古埃及神话中力量的象征,赛特;补天救世的创世之神,女娲……君主类的从者有统一罗马帝国的国王,君士坦丁;古不列颠最富传奇色彩的国王,亚瑟王等。
除此之外,更有学者,发明家,冒险家,航海家,艺术家等众多特质从者!
更多精彩内容,尽在《幻象回忆》!
【关于游戏】
人类消失后200万年,这个世界的和平被冠上了虚伪的罪名。拥有强大力量的幻象(Mirage)在地面上建立国家、划分领土、互相争斗。战争,逐渐将世界引向灭亡。世界面临破灭之时,拥有强大力量的「御主」被召唤至此,守护世界的彼端。「毁灭」与「约定」超越千年时光而来,跨越历史、记忆与时空的旅途拉开序幕——
】公冶笑卉 | 2025-01-05 |
加强优化啊 |
尔彤霞 | 2025-01-05 |
奋斗的巧克力😇 : 我怕手机内存不够 |
貊子悦 | 2025-01-05 |
我们会持续优化仙友们所反馈的问题,以给仙友们带来更好的游戏体验。祝您游戏愉快! |
藏泽 | 2025-01-05 |
家园 |
开芝英 | 2025-01-05 |
任贤齐整部电影都是一个表情,以前演技还可以啊,这是怎么了。配音也一塌糊涂,听不出任何感情。 |
魏晓莉 | 2025-01-05 |
我不喜欢它是按级别来的,它也会降低 fps |
张安露 | 2025-01-05 |
还不错啊,颜色适合我,跟图上的一样,没什么色差,表白那个绿色的发带我怎么带出去,你到是说说。 |
訾白易 | 2025-01-05 |
Official酷儿 : 尤金辣么可爱,为啥不给五颗小星星吖 Ծ‸Ծ |
巧清婉 | 2025-01-05 |
可以,三十抽俩金,八说了,快来! |
师彦 | 2025-01-05 |
Ppppppppppppppppppppppppppopppppppp//@顶小炫and基轮:是潘玮柏配//@飞宏一号:当阿宝上找到他的老爸后————父子终于团聚了。 但阿宝爸,此时透露了一个令阿宝震惊的消息! 阿宝爸:阿宝,难道你还不明白吗?羊仙姑一直就是凤凰城内的卑鄙无耻之徒啊!羊仙姑告诉沈的父母将会打败沈的是一名黑白相间的武士,但后来,羊仙姑与沈密谈,打败沈的是熊猫!是羊仙姑怂恿沈率兵出城去杀熊猫的,是羊仙姑暗中骗过四川的朝廷官兵,让沈得以轻易地灭了四川所有的熊猫的!阿宝,这等大仇,岂能不报?! 阿宝:什么?!//@oyzhzx:阿宝在国语里的配音是任贤齐配的吧 |