“考古”周靖人,新任阿里云CTO、主导LLM、推动MaaS、AI开源,下一步如何与云整合?
4201
2023-04-06 19:39
文章摘要:坚持独立的思考,不局限于此刻。‍

撰文 / 宇婷

坚持独立的思考,不局限于此刻。‍‍‍

2023年4月11日,阿里云北京峰会即将召开。在百度、360相继公布了自身的大模型产品以及进展后,这一次峰会被受众高度关注,聚焦在:阿里是否会正式公布其大模型的进展,以及将与阿里云如何整合?

对比微软和微软云Azure,大模型会对云业务本身会产生巨大的拉动。首先,微软向OpenAI投资100亿美元,获得OpenAI 75%的直接利润份额。其次,所有OpenAI的技术都运行在Microsoft的Azure云基础架构上,形成云资源的调用。最后,微软还将OpenAI的人工智能整合到Word、PowerPoint、Outlook和其他应用程序中,推动包括Teams、Loop等产品的用户量提升。

尽管中国厂商追赶ChatGPT3.5可能还要以1年为单位,但国内百度、阿里、字节、腾讯、360等大型公司,有着充足的区域市场。大厂竞争大模型,也在竞争AI生态。

文心一言目前已经有了先发优势。

对于阿里来说,根据业内消息,其特质是在AI算力的储备上充足,包括A100显卡资源目前在国内厂商中储备位列行业第一,以及寒武纪芯片等有所供应。此前阿里云也发布了自己的结构路线。

阿里巴巴在LLM(大型语言模型Large language mode)领域的研究主要由达摩院负责,目前由阿里云智能CTO、达摩院副院长周靖人主导。在2022年阿里巴巴层发布了相关自然语言大模型技术M6和plug。

阿里巴巴大模型研发成功会对天猫、淘宝、高德、钉钉等业务应用直接带来直接的商业价值。此外,直接通过阿里云向TO B客户提供,也会构建新的MaaS商业模式。

在两周前的阿里云北京数据库峰会上,周靖人曾有过一个简短的演讲,我查看了下周靖人过往在AI领域表达的观点,看得出周靖人对于MaaS的思考前置于这一波ChatGPT热浪,并且展现出了技术和应用的平衡。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

1、成为阿里云CTO前,领导阿里大数据智能研究‍‍

在2022年12月29日阿里巴巴董事会主席兼CEO张勇发出全员邮件中,宣布了周靖人(靖人)将担任阿里云智能CTO,并同时继续兼任达摩院副院长。

根据搜狗百科,周靖人2004年获得美国哥伦比亚大学计算机博士学位,后加入微软担任研发合伙人。微软期间带领团队研发了支撑着微软必应搜索,Office 和 Windows 等高性能大数据计算平台。

他的主要研究方向包括大规模分布式系统和数据库、异构数据库,拥有16项相关专利,在国际多家权威期刊发表50多篇论文。

周靖人还是1994级中科大毕业生。

2016年,周靖人正式官宣加入阿里巴巴集团,负责达摩院智能计算实验室等工作。任职阿里云首席科学家,带领阿里云中美两地研发团队。总体负责阿里云大数据平台和人工智能研究iDST(Institute of Data Science Technology)的科研工作,涉及大规模机器学习和语音、自然语言、图像以及视频处理技术。

他是大规模分布式系统和数据库等领域的国际级权威学者,曾入选IEEE Fellow。(百科了下IEEE Fellow,即IEEE会士,是IEEE最高级别成员,也是IEEE授予成员的最高荣誉,在学术科技界被认定为权威的荣誉和重要的职业成就;当选人需要对工程科学与技术的进步或应用做出重大贡献,为社会带来重大价值。)

2017年,他做了《阿里云大数据分析与智能》主题演讲。

根据媒体新智元对当时演讲的报道,当时他演讲观点:‍‍‍‍

“各大公司的计算架构都很类似,但是阿里云的特色在于架构间各种资源是共享的,并且,由于是自建系统(home built system),系统在调度和部署时也会便利很多。”

当时他还提到了一个比较有趣的挑战——算法是不断变化的。如果针对某个问题开发了一个特定的芯片或解决方案,解决方案和算法会随着时间的推移而改变,这样就会开发出很多特定的芯片和解决方案,然后就必须应对新的指令集,并在这么多不同的芯片上创造生态系统。‍‍‍

2018年双11,周靖人领导大数据智能计算团队,支撑双十一交易洪峰。2分05秒100亿元,以及实时日志处理峰值每秒17亿条。‍‍‍‍‍‍‍‍

2020年在阿里内部组织变革中晋升。2022年12月,他正式任职阿里云智能CTO,兼任达摩院副院长。

在阿里巴巴,他曾涉猎的工作包括了:淘宝事业群搜索推荐、达摩院智能计算实验室、阿里大数据智能计算和搜索推荐平台。‍‍‍‍‍

2、推动MaaS在阿里内部落地

根据媒体AI科技评论的报道,2021 年 3 月达摩院发布国内首个千亿参数多模态大模型 M6。那时周靖人作为项目主导人,从立项开始就思考如何更好地释放像 M6 这样的大模型的基础能力。

报道提到,他思考的结果是——必须要有一个平台作为依托。在内部讨论中,这个想法一出来,就得到了达摩院各个实验室带头人的赞同。并且周靖人不断地把「模型即服务」(Model as a Service,MaaS )的理念在内部推动头脑风暴。

2022年,阿里达摩院与 CCF 开源发展委员会联合正式推出国内首个 AI 模型开源社区——魔搭 ModelScope。把300 多个模型开放给整个中国的 AI 研究者与团队,涵盖了自然语言处理、视觉、语音、多模态等模型。

魔搭社区的核心关键词是:开源。当时周靖人在接受媒体采访时,提到其口号是:「 AI for Everyone」周靖人解释了这句话的含义:无论是 AI 兴趣爱好者,还是使用者、开发者、研究者,“模型即服务”理念均能承载不同人群对AI 的诉求,进一步落地 AI 应用。‍‍

我理解,魔搭是意图通过MaaS在具体商业场景中落地。平衡学术与应用。‍‍

“大模型的研发不应该是一场少数机构的竞赛,而应该通过大小模型的协同进化走向更高级的应用,尤其是适应中国本土需求的应用。”

作为中文大模型。‍‍‍‍,2022年11月 CSDN创始人蒋涛曾对话周靖人‍‍探讨了 AI 模型社区魔搭 ModelScope,以及背后包括澜舟科技、智谱AI、深势科技、中国科学技术大学等多家科研机构的开源生态。‍

周靖人提到了国内关于AI大模型的应用落地挑战:

“AI 模型难以覆盖各行各业的 AI 应用需求,面对新场景时,往往需要进行二次开发或优化,否则许多模型难以适配到特定环境应用中,AI 模型定制化门槛较高。以及缺乏 AI 模型开发和使用交流分享的平台。当开发者遇到相关问题后,无法找到对应的模型服务,也找不到人来解答他的问题。”

“达摩院提出模型即服务(Model as a Service)。背后逻辑是把 AI 模型当作生产的重要元素,从模型预训练到二次调优,最后到模型部署,围绕模型的生命周期来提供相应的服务。”

周靖人也提出了做法:

一是提供模型仓库,收集模型,提供优质数据,还可针对业务场景调优。模型使用和算力需结合在一起,并提供快速体验模型,让广大开发者无需写代码就能快速体验模型的效果。

二是提供抽象接口或 API 接口,以便开发者针对模型进行二次开发。当面对具体应用场景时,提供少样本或者零样本的方式便于开发者对模型做二次优化,真正让模型应用到不同的场景中。

2022年,魔搭上比较成熟的模型包括:澜舟科技的孟子系列模型,深势科技的蛋白质结构预测模型 Uni-Fold,智谱 AI 的多语言预训练模型等。

在CSDN的访谈中,还提到魔搭的商业模式突破。对比Huggingface 从明星项目 Transformer 库入手,随后构建平台让用户可以托管相关的机器学习模型和数据集,还可共享、协作与投入生产应用,目前在国外生态蓬勃发展。

周靖人认为魔搭社区填补 AI 模型应用服务的空白,建设 AI 开发者生态。魔搭更关注本土需求,提供大量中文模型,第一批提供的中文 AI 模型已超过 100 个,覆盖自然语言处理、语音等常用任务。‍

3、AI与云到底是什么关系。

AI 模型涉及大量的数据、算力,脱离云,在线下很难找到适合的机器来运行,AI 模型的开发和使用目前需要在云计算之上。(魔搭对接了阿里云机器学习平台 PAI 和弹性计算 ECS‍‍‍‍‍)

在两周前的阿里云数据库北京峰会上,阿里云智能CTO周靖人也在当天的演讲中提到一点:“把数据能够有效地管理起来,特别是今天我们如何做好数据的存储、数据的分析。如何使用好数据,也发生了一系列的范式的转变。”

2023年春,AI让大众使用ChatGPT、微软办公软件,能够支付得起费用的人群直接步入AI纪元,云和AI真正到了生产力飞跃的奇点。

不久前,在访谈阿里云数据库负责人李飞飞时,也了解到。

他认为:过去一二十年是信息时代数字化,也就是说企业的信息化办公实现了数字化。AI到了临界点,一定会催生这么两件事,一个叫物理世界数字化,还有一个是生物世界数字化。数据库在这里会发挥什么样的关键作用?第一,多模态的数据一定会成为事实标准,因为宏观世界数字化、微观世界数字化各种各样的数字一定会层出不穷,数据的多样性就像生物有多样性,数字化的世界里数据也是有多样性的。

仅仅回到云服务中的数据库纬度,多模态数据的存储和处理会促进处理多模态数据库爆发式增长。

云计算是以算力为基础,以数据为核心,以技术为牵引——这是计算算力的服务化,这就像是电力服务化一样。算力服务化以后,使之有意义的是数据的注入,因此物理世界数字化、生物世界数字化进一步映射。而以ChatGPT为代表的多模数据应用和背后的算法架构成为趋势后,算力+数据+智能,这是期待已久的数据核裂变。

本文部分观点,参考阿里云数据库负责人李飞飞的演讲。



版权声明:

凡本网内容请注明来源:T媒体(http://www.cniteyes.com)”的所有原创作品,版权均属于易信视界(北京)信息科技有限公司所有,未经本网书面授权,不得转载、摘编或以其它方式使用上述作品。

本网书面授权使用作品的,应在授权范围内使用,并按双方协议注明作品来源。违反上述声明者,易信视界(北京)信息科技有限公司将追究其相关法律责任。

标签:

评论