通义

阿里云旗下语言模型
展开2个同名词条
收藏
0有用+1
0
通义,由通义千问更名而来 [56],是阿里云推出的语言模型 [4],于2023年9月13日正式向公众开放。 [12]属于(AI Generated Content,AIGC)领域, [29]是一个MaaS(模型即服务)的底座。 [40]多模态大模型(Multimodal Models)。 [59]
通义意为“通情,达义”,具备全副AI能力,致力于成为人们的工作、学习、生活助手。 [56]功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持,能够跟人类进行多轮的交互,也融入了多模态的知识理解,且有文案创作能力,能够续写小说,编写邮件等。 [4]
2023年4月7日,通义的前身通义千问开始邀请测试 [1],4月11日,通义千问在2023阿里云峰会上揭晓。 [3]4月18日,钉钉正式接通通义千问大模型。 [7]9月13日,通义千问大模型通过首批备案,正式向公众开放。通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。 [12]12月1日,阿里云开源通义千问720亿参数模型。 [15]12月22日,阿里云通义千问成为首个“大模型标准符合性评测”中首批通过评测的四款国产大模型之一,。 [17]2024年4月7日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡。 [51]5月,通义千问2.5大模型发布并更名。 [55-56]5月9日,阿里云正式发布了通义千问2.5版本。 [57] [61]
2024年8月19日,通义千问宣布启用新域名:tongyi.ai。 [68]
2025年3月6日,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B。3月27日,通义千问宣布发布Qwen2.5-Omni [89]。4月29日,通义App全面上线千问3。 [95]
软件名称
通义
上线时间
2023年9月13日
最近更新时间
2024年5月9日 [55]
开发商
阿里云 [2]
原    名
通义千问 [56]

出现背景

播报
编辑

时代背景

大模型是人工智能领域的热门研究方向。专家认为,人工智能进入产业级大模夜悼型时代。大模型将是未来一段时间科技领域里面最重要的事挨察海情之一。大模型将开启人工智能的“大一统时代”。 [59]
人工智能是引领新一轮科技革命与夜糠府巩产业变革的战略性技术,是赋能经济社会数字化、绿色化双转型的主要引擎,具有很强的“头雁”效应。 [59]
这些模型使用大量的多媒体数料腊悼据资源作为输入,并通过复杂的数学运算和优化算法来完成大规模的训练,以学习和理解到输入数据的模式和特征。这些模式和特征最终通过大模型中庞大的参数进行表征,以获得与输入数据和模型设计相匹配的能力,最终来实篮愉凝现更复杂、更广泛的任务,如语音识别、自然语言处理、计算机视觉等。 [59]

技术背景

  • 视觉算法基础
传统机器学习算法中,可通过图像特征描述子SIFT、SURF、BRIEF进行特征点提取和匹配,车载自动驾驶摄像头里面用的图像识别类算法基本上都是CNN的结构,为卷积神经网络。卷积神经网络认知图像的过程跟人大脑认知图像的原理类似。图像输入即输入摄像头的数据,以每帧信息为基础进行检测、分类、分割等计算,最后利用多帧信息进行目标跟踪,输出相关结果。 [58]
视觉算法近年来的突破在泛化性、可提示性、生成质量和稳定性等方面均取得了进展,预示着技术拐点的临近以及爆款应用的涌现。由于扩散算法的成熟,对3D资产生成和视频生成领域有促进作用。 [28]
  • 行业发展基础
随着科技发展,AI 的开发门槛降低,人们期待小学生也能她踏用各种模型进行开发,因此需要形成一个一个模型的不同层级的结构。一个通用的模型其实也很难解决所有问题,从设计者、开发者的角度出发,围绕着模型作开发的范式逐渐诞生。 [40]
  • 大模型首次出现
2022年11月30日,美国人工智能研究实验室OpenAI推出ChatGPT,这是一种人工智能技术驱验定汽动的自然语言处理工具,使用了Transformer神经网络架构,也是GPT-3.5架构,这是一种用于处理序列数据的模型,拥有语言理解和文本生成能力。 [27]
Transformer神经网络架构
ChatGPT会通过连接大量的语料库来训练模型,语料库包含了真实世界中的对话,使得ChatGPT具备上知天文下知地理,还能根据聊天的上下文进行互动,做到与真正人类几乎无异的聊天场景进行交流。ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。 [27]也能够通过学习和巴断理解人类的语言来进行对话。 [27]

名称由来

播报
编辑
初期,通义前身为通义千问,前者的“通义”取自《汉书》中的“天地之常经,古今之通义也”,有“普遍适用的道理与法则”之意 [26];后者的“千问”寓意千万次的问,千万的学问,能问出千问的一定是真爱,能回答千问的,也一定是真有学问,以及AI和阿里云一样,都有千万次交互的热情。 [40]
2024年5月,更名为通义,意为“通情,达义”,具备全副AI能力,致力于成为人们的工作、学习、生活助手。 [56]

发展历程

播报
编辑
2023年4月7日,通义千问开始邀请测试。 [1]
2023年4月11日,阿里巴巴所有产品未来将接入通义千问大模型,进行全面改造,包括天猫钉钉高德地图淘宝优酷、盒马等 [5];同4月,钉钉首次发布基于阿里千问大模型的智能化能力,用户输入斜杠“/”即可唤起10余项AI能力。 [6]通义千问 AI 大模型接入天猫精灵,开启相关内测招募。阿里云工程师在实验将千问大模型接入工业机器人,在钉钉对话框输入一句汉字,可远程指挥机器人工作。 [8]
2023年9月,通义千问正式向公众开放;淘宝内测应用淘宝问问接入通义千问,基于通义千问的文本理解与文本生成能力实现全新的交互体验以及推荐 [30];同月25日,阿里云宣布开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用 [10];同年10月31日,2023云栖大会现场,阿里大模型家族全面升级发布,通义千问2.0正式升级发布。通义千问App也随之发布。 [11]
参数模型Qwen-14B-Chat
2023年11月7日,阿里云旗下通义千问 App 上架苹果App Store,安装包大小为 25.9 MB,此前这款 App 已在各大安卓应用市场上架 [13];同月16日,阿里巴巴公告,截至9月30日,钉钉17条产品线已经全面接入大模型。钉钉还面向客户及生态体系合作伙伴开放其智能化底座AIPaaS,以助生态体系参与者重塑其产品。 [14]
2023年12月1日,阿里云开源通义千问720亿参数模型Qwen-72B、18亿参数模型Qwen-1.8B及音频大模型Qwen-Audio [15];同月2月22日,国内首个官方“大模型标准符合性评测”结果公布,阿里云通义千问成为首批通过评测的四款国产大模型之一,在通用性、智能性等维度均达到国家相关标准要求。 [18]
2024年1月4日,阿里云旗下的通义千问 App 上线了一项免费的新功能“通义舞王”:用户在按照提示要求上传照片后,经过十几分钟的等待,即可自动生成舞蹈视频 [19];同月22日,由中国一汽联合阿里云通义千问打造的大模型应用GPT-BI落 [21];同月26日,阿里云公布多模态大模型研究进展。通义千问视觉理解模型Qwen-VL再次升级,继Plus版本之后,再次推出Max版本。 [22]
2024年3月22日,阿里云旗下的通义千问宣布升级,向所有人免费开放1000万字的长文档处理功能 [44];同月29日,通义千问团队开源首个MoE模型,名为Qwen1.5-MoE-A2.7B,有27亿个激活参数。 [24]
2024年4月3日,刚刚成为阿里云一号AI员工的通义灵码正式上线通义千问APP,并向全民免费开 [25];同月7日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本 [51];同月28日,据“阿里通义千问”消息,通义千问首次推出千亿级参数模型Qwen1.5-110B。Qwen1.5-110B是Qwen1.5系列中规模最大的模型,也是该系列中首个拥有超1000亿参数的模型。 [54]
2024年5月,通义千问2.5大模型版本发布并更名为通义。 [55-57]5月21日消息,阿里云宣布通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。 [61]
2024年6月7日,阿里通义千问Qwen2大模型发布,并在Hugging Face和ModelScope上同步开源。 [62]
2024年6月21日,携程已接入阿里云通义千问大模型,支持其全球业务发展。此外,哈啰集团已与阿里云达成深度合作,全方位接入阿里云通义大模型。 [63]
2024年7月,在2024世界人工智能大会上,阿里云CTO周靖人透露,近2个月,通义千问开源模型下载量增长2倍,突破2000万次,阿里云百炼服务客户数从9万增长至23万,涨幅超150%。 [64]
2024年7月26日,巴黎奥运会期间,通义App上线赛事百事通、全民云运动、AI运动写真等多款新功能。这些新功能基于通义大模型打造,让国内体育迷们看奥运、聊奥运的同时,也能体验AI技术带来的观赛新体验。 [65]7月31日,阿里通义宣布免费开放奥运AI大模型,具备最强奥运专业知识,并集合同声传译级别的中法互译功能。7月31日起,用户可以在通义APP免费使用。 [66]
2024年8月,阿里通义千问开源 Qwen2-Audio 系列的两个模型 Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。 [67]8月19日,通义千问宣布启用新域名:tongyi.ai。 [68]8月30日消息,通义网页版上线“PPT创作”功能,具备言之有物、设计精美、智能编排三大核心特点。 [69]8月30日,阿里通义千问发布第二代视觉语言模型Qwen2-VL,旗舰模型Qwen2-VL-72B的API已上线阿里云百炼平台。 [70]9月2日消息,阿里云通义千问宣布源第二代视觉语言模型 Qwen2-VL,并推出 2B、7B 两个尺寸及其量化版本模型。同时,旗舰模型 Qwen2-VL-72B 的 API 已上线阿里云百炼平台,用户可直接调用。 [71]9月19日消息,2024云栖大会上,阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5。 [72]9月19日,阿里巴巴宣布,阿里云百炼平台上的三款通义千问主力模型再次降价。其中,Qwen-Turbo的价格低至每百万输入tokens0.3元,较之前直降85%,Qwen-Plus和Qwen-Max的输入价格则分别降价80%和50%。 [73]11月15日,从阿里云方面获悉,旗下大模型通义上线代码模式,一句“大白话”就能生成应用,包括小游戏、数据图表、网站、简历等。 [74]11月27日,通义官宣通义App鸿蒙原生版正式上架HarmonyOS NEXT应用市场。 [75]12月25日,阿里云通义千问发布首个开源多模态推理模型QVQ-72B-Preview。 [76]12月31日,阿里云官宣!本年度第三轮大模型降价,通义千问视觉理解模型全线降价超80%。其中Qwen-VL-Plus直降81%,输入价格仅为0.0015元/千tokens,创下全网最低价格;更高性能的Qwen-VL-Max降至0.003元/千tokens,降幅高达85%。 [77]
2025年1月27日,阿里云通义千问Qwen团队正式推出开源的Qwen2.5-1M模型及其对应的推理框架支持。本次发布了两个新的开源模型,分别是Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M,这是Qwen首次将开源的Qwen模型的上下文扩展到1M长度。 [78]1月29日,阿里云通义千问旗舰版模型Qwen2.5-Max正式发布。该模型预训练数据超过20万亿tokens。 [79]截至2月19日,阿里通义千问开源模型下载量为2亿,基于阿里通义模型衍生模型数量超过9万个,此外阿里的魔搭社区有超过4万家模型入驻,有超过1000万用户数。 [80]
布通义千问2.5发布现场
2025年2月28日,荣耀表示,已与阿里在 AI 领域展开合作,为全球用户提供服务。目前千问(Qwen)、万相(Wan)等多款语言、视觉理解、图像生成模型已接入荣耀 YOYO 智能体,用户可通过 Magic7 系列手机等终端体验 AI 功能。 [81]
2025年3月6日,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B。 [82]3月11日,Manus平台宣布与阿里通义千问团队正式达成战略合作, [83]双方将基于通义千问系列开源模型,在国产模型和算力平台上实现Manus的全部功能。 [84]
2025年3月11日,基于全模态场景,通义实验室团队探索了 RLVR 与视频全模态模型的结合,宣布开源 R1-Omni 模型。R1-Omni 的一大亮点在于其透明性(推理能力)。通过 RLVR 方法,音频信息和视频信息在模型中的作用变得更加清晰可见。 [85]3月14日消息,英国、新加坡、日本等多国创企接入阿里通义千问。 [86]3月,LiblibAI接入阿里通义系列大模型。 [87]3月26日,宝马集团宣布与阿里巴巴集团在中国达成AI领域战略合作,双方在AI大语言模型和智能语音交互等领域开展联合研发,阿里通义大模型将应用于中国市场的宝马新世代系列车型。 [88]3月27日,通义千问宣布发布Qwen2.5-Omni [89]。4月29日,阿里巴巴通义千问发布新版Qwen3系列模型,包括2个MoE模型和6个dense模型,参数量从0.6B到235B。 [92]称其在数学和编程等多个方面均可与DeepSeek的性能相媲美。与其他主流模型相比,Qwen3还显著降低了部署成本。 [93]4月29日,通义App与通义网页版全面上线阿里新一代通义千问开源模型Qwen3(简称千问3),用户可以第一时间在通义App和网页版中的专属智能体“千问大模型”,以及主对话页面,体验到全球最强开源模型的智能能力。 [94]6月6日上午消息,阿里开源通义千问3全新的向量模型系列 Qwen3-Embedding(简称千问3向量模型)。 [98]6月9日,阿里云发文宣布:比亚迪接入通义大模型。 [99]

主要功能

播报
编辑
通义千问是阿里巴巴达摩院自主研发的超大规模语言模型。诞生源于阿里巴巴对人工智能技术的探索和实践,旨在为各行各业提供优质的自然语言处理服务,并且能够应对各种复杂的任务挑战。 [39]
截至2024年5月,通义千问提供通义灵码(编码助手)、通义智文(阅读助手)、通义听悟(工作学习)、通义星尘(个性化角色创作平台)、通义点金(投研助手)、通义晓蜜(智能客服)、通义仁心(健康助手)、通义法睿(法律顾问)8大行业模型。 [12] [16] [32]
8大行业模型可以帮助人们写代码、读代码、查BUG、优化代码等;短时间内获取长文本提要和概述,掌握要点;对音频内容转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT提取等功能,并支持标重点、记笔记; [33]可以解读财报研报,分析金融业事件,自动绘制图表表格,实时市场数据分析等。 [34]
通义开源模型

系列产品

播报
编辑

通义APP

是阿里巴巴旗下实用的AI助手,拥有数千万用户,为用户提供日常办公、学习提效和生活健康、娱乐等全方位支持。
在日常办公中,通义提供专业文档撰写、实时记录、音视频速读和代码生成解释、代码纠错等服务,支持跨文档摘要、分析和内容创作。
学习方面,通义具备图像和视频理解能力,可拍照讲题、在线解析网页、论文与图书,实现多文本摘要和结构化总结,并提供实时翻译功能。
生活娱乐方面,通义提供全民舞台、AI生图、AI生视频和照相馆等趣味玩法,帮助用户创作有趣的图片和视频。通义还提供多元化智能体创建功能,包含健康、国学、预测、星座、法律等,用户可轻松配置所需工具或聊天角色。 [90]
连续两年登顶QuestMobile“中国互联网AIGC应用用户规模TOP榜”,获华为应用市场评为“最佳新锐合作伙伴”。 [90]

通义灵码

通义灵码可以辅助程序员写代码、读代码、查BUG、优化代码等。掌握JavaPython、Go、JavaScriptTypeScript、C/C++、C#等200多种编程语言,可帮助程序员提升超10%的开发效率。程序员、编程爱好者、学生无需下载专业软件,使用通义千问就能写代码和学代码。 [31]

通义智文

通义智文是阿里云推出的基于通义大模型的免费AI阅读助手,可智能阅读网页、论文、图书和文档,帮助用户在短时间内获取提要和概述,掌握要点,提高阅读效率。同时支持自由提问,可解答用户关于文章的问题或其他不解之处。 [30]
通义智文界面

通义听悟

生活中,音视频承载了密集的信息内容,但因涉及多模态理解、自然语言处理、搜索等多项复杂技术,存在查找难、回顾难、提炼难问题。通义听悟提供包括转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT提取等功能,并支持标重点、记笔记。 [33]
通义听悟界面
通义听悟也可以通过多语言Query处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,实现对超长音视频的单记录、跨记录、多语言自由问答。 [33]
用户不仅可在单一记录页呼唤小悟,对最高6小时、6G大小的音视频提问任何相关话题,可直接要求小悟整理金句、梳理结论、写会议纪要;更可在首页针对用户所有记录提问,支持一次性扫描理解上百条音视频内容;也可对英文视频用中文提问,将直接给出中文回答。 [33]

通义星尘

通义星尘是一款个性化角色创作平台,其基于大规模高质量个性化对话数据,采用分阶段的个性化训练策略,使得模型在保持通用能力的基础上,延伸出拟人、具有情感、鲜明语言风格的能力,在角色的个性、风格遵循上具有更强的指令遵循能力。可以深度定义人设、和用户建立起深度连接、支持多种形式的对话互动,并且可以基于具体的事件设定展开对话。可应用于情感陪伴、游戏NPC、IP复刻等场景。 [32]

通义点金

通义点金可以解读财报研报,分析金融业事件,自动绘制图表表格,实时市场数据分析。 [34]智能投研机器人可以分析事件,绘制表格,查询资讯,研究财报;文档分析机器人可以总结要点,扩展资讯,文档问答,片段分析,财报、研报公告;金融信息搜索引擎可以搜数据、查研报、找公告等。 [34]

通义晓蜜

通义晓蜜提供全渠道联络中心与AI应用的整体方案,助力企业服务向信息化、智能化、多模态转型。
其中,对话机器人支持多种形态的知识,比如文档网页、高频问题、复杂多轮、表格、数据库等;智能坐席助理全方位陪伴人工坐席,助力客服、销售业绩提升,提供产品介绍、通话过程剖析、案例沉淀、通话技巧提升等功能;多模态智能联络中心则为全渠道多模态的企业智能服务平台,支持电话、IM、视频统一接入、统一调度服务数据和客户体验完整、一致,也为客户给提供面向下一代的多模态服务体验,告别单调的文字、语音交流。 [35]

通义仁心

通义仁心是个人健康助手,提供问报告、问症状、问用药、问疾病功能。 [36]

通义法睿

通义法睿能够回答用户提出的法律问题,具有推理法律适用、 推送裁判类案、辅助案情分析、生成法律文书、检索法律知识等功能。旨在帮助法律专业人士提高生产力水平, 同时也可为非专业人士提供便捷的法律咨询服务。
提供针对用户的法律问题,以法律规定作为大前提,情形匹配作为小前提,按照逻辑三段论推理生成答案;根据用户描述的文本信息或上传的材料信息,结合专业模版定制化生成起诉状、答辩状等文书;利用大模型推理优势,通过语意理解提高用户搜索准确性和相关性,从法规和判例库找准信息。 [37]

长文本功能

通义千问向所有人免费开放1000万字的长文档处理功能。通过调优算法或者通过算力甚至使用RAG(检索增强生成技术,是对大型语言模型输出进行优化的方法,使其能够在生成响应之前引用训练数据来源之外的知识库),都可以打造出该体验。 [44]

模型框架

播报
编辑
通义千问模型基于Transformer框架,采用了开源大语言模型训练方法LLaMA。 [52]

模型修改

开发团队对架构主要做了以下修改: [52]
  • Embedding and output projection:通义千问模型选择了不受限的嵌入方法,而不是捆绑输入嵌入和输出投影的权重,此项改动是为了以内存成本为代价获得更好的性能。
  • 位置编码(Positional embedding):模型采用RoPE(Rotary Positional Embedding)为位置编码,并选择使用FP32精确度而不是BF16或FP16的逆频率矩阵,以此提高模型的性能表现和精确度。
  • 偏差(Bias):开发团队在模型中的大多数层(layer)种移除了偏差,而是在QKV注意力层中添加了偏差,以增强模型的外推能力。
  • Pre-Norm & RMSNorm:模型采用预规范化方法(pre-normalization)提高训练稳定性,并将传统层归一化方法替换为RMSNorm。
  • 激活函数(Activation function):模型采用SwiGLU激活函数,缩小了前馈网络(feed-forward network ,FFN)的维度,由原来隐藏大小的4倍变成隐藏大小的8/3倍。 [52]

关键技术

Transformer模型的注意力机制在上下文长度上有很大的限制,即随着上下文长度的增加,二层复杂度计算会使模型的计算成本和内存成倍增加。千问模型利用了简单的免训练技术,在推理过程中扩展上下文长度,这些技术包括:
  • NTK感知插值:这项技术以免训练的方式调整尺度以防止高频信息丢失,为了进一步提高性能。开发团队还实现了一个名为动态NTK感知插值的简单扩展动态NTK感知插值,它按块动态改变规模,避免严重的性能下降。这些技术有效地扩展了Transformer模型的上下文长度,而不会影响其计算效率或准确性。
  • LogN-Scaling:这项技术通过一个取决于上下文长度与训练长度之比的因子重新调整查询和值的点积,确保注意力值的熵随着上下文长度的增长保持稳定。
  • Window attention:这项技术将注意力限制在一个上下文窗口内,防止模型关注到太远的内容。基于千问模型的长上下文建模能力在不同层之间有所不同,与较高层相比,较低层对上下文长度扩展更加敏感,开发团队为每一层分配不同的窗口大小:较低的层使用较短的窗口,而较高的层使用较长的窗口。 [52]

模型训练

千问模型的训练遵循自回归语言建模的标准方法,即模型通过前面Token的内容预测下一个Token,其他训练细节包括:模型训练的最大长度为2048,为了构建批次数据,开发团队对文本内容进行随机打乱及合并,再将其截断到指定长度;模型在注意力模块(attention modules)采用Flash Attention技术,以提高训练速度;模型在优化器(optimizer)方面采用标准优化器AdamW,设置超参数β1、β2和ϵ为别为0.9、0.95和10−8;模型采用余弦学习率计划,为每个模型大小指定一个指定的峰值学习率,学习率衰减至最小学习率峰值学习率的10%;采用BFloat16进行混合精度训练以保证训练稳定性。 [52]

平台特色

播报
编辑
通义千问大模型是一种大规模预训练模型,旨在解决智能对话、知识图谱推理和其他多模态任务。大模型的一个关键特性是能力泛化,能够适应各种新情景和任务,而不仅仅局限于训练时所遇到的特定任务。 [38]

服务特性

通义千问可提供的从IaaSPaaSMaaS的三层系统服务能力。 [45]
其中,智算IaaS服务包括可支持最大十万卡GPU单集群规模、可承载多个万亿参数大模型同时在线训练的智算集群,可为万卡规模AI集群提供无拥塞通讯的自研RDMA网络架构等;智算PaaS服务以机器学习平台PAI为核心,可支持万卡的单任务分布式训练规模,AI训练效率提升可达10倍,推理效率提升可达6倍,覆盖全链路AI开发工具与大数据服务,深度支持了通义大模型的研发。 [45]
智算MaaS服务包括通义大模型系列和以之为基础的企业定制大模型,以及国内首个“模型即服务”开放平台魔搭社区。 [45]

内容特性

通义具有知识理解和获取能力。无论是结构化知识还是非结构化知识,模型都能有效理解和抽取,提供相对精确和准确的答案。其次,模型具有泛化能力,无需进行特定任务训练即可进行多模态理解和推理。此外,模型还能够根据给定的情境理解用户的需求,提供相关的、准确的答案。最后,模型具有显著的自适应能力,可以根据不同的应用场景和用户需求进行自我调整。 [38]
动辄超千亿参数的大模型研发,不是单一的算法问题,也不是靠简单堆积GPU就能实现的,这是囊括了底层算力、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程,需要AI-云计算的全栈技术能力。 [38]

算力特性

阿里云千岛湖机房
在算力层面,阿里云为阿里大模型的研发提供了算力体系支撑。阿里云拥有中国唯一自研云操作系统飞天,单集群可达10万台规模,千亿级文件数,EB级别存储空间。阿里云已在全球建立了28个数据中心,是亚洲规模最大的云计算平台。 [38]

个性特性

各行各业的生态伙伴都可以结合自己的行业知识及场景需求,对通义大模型进行再训练和精调,打造专属大模型,并集成进自己的行业整体解决方案中。千问专属大模型具有定制化、易集成、可微调、强安全等特点。 [38]

安全特性

阿里云为通义提供数据存储空间,通过服务器端加密机制,实现高安全性、高合规性的数据保护。伙伴和企业可以上传自己的行业数据,并调用通义进行重新训练。这些数据不会被用于训练通用版的千问大模型,阿里云和任何第三方都无法触碰。 [38]

存在问题

播报
编辑
在技术层面,在2023年4月的测试中,通义无法获取最新信息,或意味着训练数据有限。通义千问表示自己的训练数据来自2021年,因此无法获取有关未来的信息。 [48]此外,通义千问的缺点是不支持多语言,只支持中文。 [49]

产品合作

播报
编辑
钉钉接入阿里通义千问大模型,开启全面智能化战略。在钉钉输入斜杠“/”即可唤起智能服务。在只要画个表拍张照,就能生成一个表单小程序。此外,钉钉斜杠还能根据需求撰写文案、设计海报等。 [9]
2023年4月,阿里集团副总裁、斑马智行CEO张春晖宣布,AliOS智能汽车操作系统已接入通义千问大模型进行测试,并正式发布斑马智行第三代汽车AI能力体系Banma Co-Pilot,相关技术将会在智己汽车上落地。 [42]
2023年4月,阿里云宣布将与OPPO安第斯智能云联合打造OPPO大模型基础设施,基于通义千问完成大模型的持续学习、精调及前端提示工程。同时,吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业表示将与阿里云在大模型相关场景展开技术合作的探索和共创。 [45]
截至2023年10月,阿里云与60多个行业进行合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。也将持续支持千行百业的开发者基于通义千问开源模型进行模型和应用创新。 [41]
2023年11月,阿里巴巴宣布,所有产品将接入“通义千问”大模型,进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。 [5]
2023年11月发布会
2024年3月28日消息,全球最大的智能手机芯片厂商MediaTek联发科,已成功在天玑9300等旗舰芯片上部署通义千问大模型,首次实现大模型在手机芯片端深度适配。 [23]
2024年4月14日,中国科学院国家天文台人工智能工作组发布基于阿里云通义千问开源模型打造的天文大模型——“星语3.0”。 [53]“星语3.0”基于阿里云通义千问开源模型打造,已成功接入国家天文台兴隆观测站望远镜阵列--Mini“司天”。 [53]
2024年5月17日,阿里云表示,微博已接入阿里云通义大模型。据悉,微博是阿里云最早一批上云客户,也是阿里云通义大模型的最早客户。 [60]
2025年4月,义乌商城集团宣布正式接入阿里通义大模型。 [91]
国家天文台依托阿里“通义千问”模型打造“金乌”大模型。经过监督学习和强化学习,“金乌”已经能够理解和回答有关太阳物理的问题,并能认识太阳的图像,分析、预测X级耀斑达到了95%的准确率和100%的真实阳性率。 [96]
截至2025年4月,阿里通义千问已服务复旦大学、山东大学、东南大学、中科院等300多家机构院所,推动大模型助力科研创新。 [96]
2025年5月,阿里巴巴集团与SAP宣布达成战略合作。SAP将探索接入通义千问大模型,并支持企业在阿里云上部署SAP ERP云及SAP ERP私有云版本。双方将共同扩展企业级市场客户,初期聚焦于中国市场,并逐步扩展至东南亚、中东和非洲。 [97]

社会评价

播报
编辑

行业评价

长文本能力或可以成为大模型公司吸引市场关注,赢得竞争的路径之一,不过要做好“长”“准”、成本三者之间的平衡,还需要不断摸索。 [44](新京报 评)
通义千问更成熟了,也更好用了。通义千问2.0在指令遵循、工具使用、精细化创作等方面作了技术优化,能够更好地被下游应用场景集成。通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。 [50](财经网科技频道 评)

自我评价

通义千问将提供完备的算力和大模型基础设施,让包括创业公司在内的所有企业和机构更好地实现创新。 [43](阿里云智能首席技术官周靖人 评)
OpenAI是目前(截至2023年4月)全球大模型研究领域的引领者,ChatGPT是非常优秀的模式,通义千问还在不断学习和成长中。尤其GPT-4在推理、数学等方面有表现,通义千问尚不能及。当然,通义千问也有自己较为擅长的领域,比如在文本对话、阅读理解等方面。(阿里云 评) [45]

内部评价

对于普通人来说,未来也无需下载专业软件,使用通义千问就能写代码和学代码。针对没有代码基础的学生,通义千问可以提供学习建议。正如汽车的出现让一部分马车夫没有了工作,但却产生了司机这个新的职业。人类程序员和 AI 程序员的关系,应该是相互促进、共同学习。 [46](机器之心 评)
大模型正在成为人们工作和学习的重要辅助工具,长文档处理是很多用户的刚需,它能针对用户上传的文档进行解析、摘要和问答。随着模型性能升级,大模型的长文档处理能力从早期的几千字发展到后来的几万字、几十万字,如今,阿里通义千问把天花板直线拉高到了千万字。 [47](《钱江晚报》评)

相关事件

播报
编辑
维权案件
2024年1月16日,中国国内大模型打假维权出现首例胜诉判决。阿里云、阿里巴巴诉山寨通义千问APP发布方一审胜诉,飞游科技公司因侵犯注册商标及虚假宣传,被责令赔偿相关经济损失及维权费用,并于官网连续十五日发布道歉声明。 [20]