与全球关注人工智能的顶尖精英一起学习!数字化转型网建立了一个专门讨论人工智能技术、产业、学术的研究学习社区,与各位研习社同学一起成长!欢迎扫码加入!

没想到的是,一直被日本看不上的韩国,在大模型领域反而比日本跑得更快些。
事实上,韩国是最早加入AI大模型研发的国家之一,但韩国的AI大模型这个国家的经济一样,只有财阀的身影,没有初创公司的故事。目前,韩国在大模型领域的代表只有互联网巨头Naver和Kakao,移动运营商巨头KT和SKT,以及通信巨头LG。
除了财阀唱主角之外,紧跟美国步伐也是他们的一个重要特点。
比如在GPT-3的应用上,2020年OpenAI发布GPT-3的论文,韩国企业在2021年就推出了相应产品,反应速度比中国更快。这种紧跟在AI方面也是如此,2020年谷歌、亚马逊等美国巨头开始推出AI加速芯片时,SKT就同步推出了自主研发的AI加速芯片SAPEON X220。
韩国在芯片半导体方面的积累也放大了它在AI大模型方面的优势。目前韩国企业正在和半导体企业积极结盟,以应对大模型发展带来的算力挑战。
比如2022年底,Naver就开始和三星电子合作开发下一代人工智能芯片解决方案,该解决方案基于Naver推出的AI大模型Hyperclova进行优化,目前开发已进入最后阶段。
同年,KT公司也对芯片设计公司 Rebellions Inc.进行了战略投资,这是一家位于韩国本土的AI初创公司,在专用芯片方面拥有独特的技术。Rebellions将为KT公司优化MI:DEUM,并推动其商业化。
除此之外,KT公司还投资了AI初创公司Moreh,并计划在今年推出一套韩国的半导体,其效率可能是现在半导体的三倍以上。KT希望通过这种方式,全面进入目前由英伟达主导的AI半导体市场。
第三点,则是韩国在AI大模型的垂类应用已经有比较多的探索。比如KoGPT在医疗保健方面的应用,Exaone在生物医药和智能制造方面的应用等等。
整体上看,韩国的AI大模型在基础设施方面非常完善,比如在算力方面有三星电子,SKT等半导体巨头;互联网方面有Naver和Kakao这样的标杆企业,这些特点都让韩国能在AI大模型的发展浪潮中走在世界前列,并推出了一系列具有代表性的AI大模型。
比如前面提到,韩国最大的搜索公司Naver在2021年推出了HyperCLOVA,韩国版的 HyperCLOVA 拥有2040亿参数,比GPT-3还要多290亿,且其中97%使用的是韩文语料。
目前,Naver已计划在今年上半年基于HyperCLOVA推出Search GPT(类似微软New Bing)并在7月份推出HyperCLOVA X,这是HyperCLOVA 的最新版本。
同样是在2021年,韩国另一家互联网巨头Kakao 旗下的AI研究部门Kakao Brain发布了一个基于GPT-3的KoGPT,之后Kakao Brain又将KoGPT更新至GPT-3.5,实现与 ChatGPT使用相同版本的预训练大模型。Kakao Brain 首席技术官 Kim Kwang-seob 表示:“KoGPT将专注于开发基于 AI 的图像创建技术和医疗保健技术。”
Kakao Brain在KoGPT之外还推出了基于人工智能的图像生成器 Karlo,BEDIT和BDiscover,类似于stable diffusion。
2022年5月,SKT推出了基于GPT-3的聊天机器人A.的测试版,用来处理客户的特定任务。目前,A.在韩国已经获得了100万用户,并计划在今年推出正式版。
2022年12月,LG集团的人工智能智库LG AI Research 推出了Exaone。这是一个拥有3000亿参数,使用图像和文本数据的多模态模型,也是目前韩国参数规模最大的模型。Exaone应用在生物医药和智能制造方面,有助于加速抗癌疫苗和创新电池的开发。

▲ 图源Exaone在电池产业和生物医药的应用
到今年1月,据韩国经济日报报道,韩国KT公司也将在上半年推出自己的类ChatGPT产品。此前,KT公司在2022年11月推出了基于GPT-3的人工智能服务MI:DEUM,它能够实时回答问题、总结报纸文章,并给出投资建议。KT公司目前也正在积极向韩国的金融服务公司推广MI:DEUM。
但韩国同时也面临许多挑战,比如韩文在语料方面和中文、日语一样,面临复杂的语言体系和语料不足的问题。
HyperCLOVA的工程师提到:“韩语是一种凝集性语言,名词后面有例子,动词和形容词的词干后面有尾音,并有各种语法性质的表达。对韩语使用类似英语的标记化已被证明会降低韩语语言模型的性能。”
除此之外,韩国产业界认为,韩国严格的数据使用规定阻碍了韩国初创企业收集足够大的数据来训练AI大模型。
韩国是目前世界上数据信息管理最严格的国家之一。虽然在2020年韩国通过了三大数据隐私法的修订法案,以放宽对个人信息使用的规定,但该国对数据使用的规定仍然比其他国家更严格。
2021年初,韩国AI初创公司Scatter Lab上线了一款基于Facebook Messenger的AI聊天机器人“李LUDA”,但仅仅过了20天,“李LUDA”就不得不终止服务,Scatter Lab甚至为此公开道歉。
原因在于,“李LUDA”上线之后,一些韩国男性用户将其视作性对象甚至“性奴隶”,肆意发泄自身的恶意。他们对“李LUDA”进行各种言语上的侮辱,并以此作为炫耀的资本,在网上掀起“如何让LUDA堕落”的低俗讨论。
受这些信息影响,“李LUDA”很快开始发表各种歧视性言论,涉及女性、同性恋、残障人士及不同种族人群。“李LUDA”的问题也牵涉出韩国的个人信息保护问题,并有相关部门介入调查。
“李LUDA”的案例就像总能直击人心的韩国电影一样,为世界AI大模型的发展提供了更多关于伦理、道德等方面的启示。许多人害怕AI的恶意,但AI其实本没有善恶之分,所谓的善恶其实都来自于人类自己,这取决于你给AI什么样数据,就像我们教予孩子什么样的知识一样。
除此之外,韩国AI大模型领域缺少初创公司的身影,且韩国对初创公司的投资也比较匮乏。
根据斯坦福大学HAI发布的 AI Index 2022,韩国初创企业获得投资额为11亿美元,仅占美国初创企业获得投资额529亿美元的2%,甚至低于以色列的24亿美元。这也导致韩国在AI初创公司独角兽方面落后于其他国家。
根据全球科技市场追踪机构 CB Insights 的数据,截至 2022 年 12 月,美国的 AI 独角兽数量最多,有 53 家初创公司。中国以 19 家位居第二,其次是英国有4家,但韩国却没有AI独角兽公司,而即使是国内生产总值 (GDP) 低于韩国的以色列也有 3 家。

▲ 图源数据来源CB Insights
一家专注于交互式 AI 技术的韩国机器学习技术的企业Genesis Lab Inc. 创始人兼CEO Lee Young-bok 表示,韩国公司总体上对人工智能并不友好,并补充说政府或公共组织应该更加积极地采用人工智能技术。
数字化转型网人工智能研习社
与全球关注人工智能的顶尖精英一起学习!数字化转型网建立了一个专门讨论人工智能技术、产业、学术的研究学习社区,与各位研习社同学一起成长!欢迎扫码加入!

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网默然。



