阿里通义千问技术骨干周畅离职创业,曾带领团队实现多模态预训练模型 M6 突破

aixo 2024-07-18 20:27:54
大模型 2024-07-18 20:27:54

机器之心报道

机器之心编辑部

今日,有市场消息称,阿里通义千问技术骨干周畅(花名:钟煌)已离职创业。据机器之心消息,周畅确将离职,但还未到最终离职日期。

周畅是通义千问大模型的重要人物。2020-2021年间,他带领团队设计并实现了超大规模的多模态预训练模型M6,在参数数量和低碳训练模式上取得了突破。今年,通义千问开源模型 Owen1.5-72B 在 模型表现榜单上()成为开源模型第一,也是开源社区普遍使用的模型系列之一。

更早之前,周畅在达摩院期间在多个项目中发挥了重要作用,如研发超大规模商品图表征算法 APP、用户表征框架 、基于自监督对比学习的向量召回算法 CLRec 系列等。

周畅本科于2012年本科毕业于复旦计算机科学与技术专业,2017年博士毕业于北京大学计算机软件与理论专业,通过校招加入阿里巴巴,在阿里履职超过八年。

他专攻领域为深度学习、图挖掘和分布式计算,在机器学习、数据挖掘、数据库领域国际顶级会议上发表 30 余篇文章,并担任 /ICML/KDD/WWW 等学术会议的审稿人。周畅团队研究成果曾获得中国电子学会科技进步一等奖、杭州市领军型创新创业团队等奖项和荣誉。

据职场Bonus援引阿里内部人士对周畅的评价是:“他很想做成通用型更强的大模型,而不是垂直于单一领域和场景”。

目前,周畅本人暂未对接下来的计划做出回应。

江苏名通科技魏义_问求泉州通淮关岳庙98_通义千问

关于通义千问

通义千问是阿里巴巴通义实验室自主研发的超大规模语言模型,通义实验室是阿里巴巴集团旗下的自然语言处理实验室,致力于研究和开发通用的自然语言处理技术,为阿里巴巴集团旗下各业务部门提供智能化的语言处理服务。目前阿里通义实验室负责人为周靖人。

2023年4月7日,通义千问开始邀请测试。

2023年4月11日,阿里巴巴所有产品未来将接入通义千问大模型进行全面改造。

2023年8月,通义千问开源了 qwen-7b 模型。

2023年9月,通义千问正式向公众开放;同月25日,阿里云宣布开源通义千问140亿参数模型 Qwen-14B 及其对话模型 Qwen-14B-Chat,免费可商用。

2023年10月31日,通义千问2.0正式升级发布,通义千问 App 也随之发布。

2023年12月1日,阿里云开源通义千问720亿参数模型 Qwen-72B、18亿参数模型 Qwen-1.8B 及音频大模型 Qwen-Audio。至此,通义千问实现了“全尺寸、全模态”开源,共开源18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型。

2024年1月4日,通义千问 App 上线“通义舞王”功能。

2024年1月26日,通义千问视觉理解模型 Qwen-VL 推出 Max 版本。

2024年3月22日,向所有人免费开放1000万字的长文档处理功能。

2024年3月29日,开源首个 MoE 模型 Qwen1.5-MoE-A2.7B。

2024年4月3日,通义灵码正式上线通义千问 APP,并向全民免费开放。

2024年4月7日,开源320亿参数模型 Qwen1.5-32B。

2024年4月28日,推出千亿级参数模型 Qwen1.5-110B。

2024年5月9日,发布通义千问2.5大模型并更名为通义。

截至2024年5月,通义千问提供了8大行业模型,涉及编程、阅读、音视频处理、角色创作、金融、客服、健康、法律等领域,可应用于写代码、读代码、查BUG、优化代码、获取长文本提要和概述、音视频内容处理、个性化角色创作、解读财报研报、分析金融业事件等场景。