数字化转型网人工智能研习社关注人工智能从技术到落地的全方面,包含机器学习算法、深度学习架构、自然语言处理(NLP)技术、计算机视觉技术、AI+医疗健康、AI+交通出行、AI+金融、AI+制造、AI+消费品、AI+互联网、数据隐私和安全、算法公平性、产业生态建设、政策法规制定与完善等。

2024年大模型行业的第二大变化就是技术路线上不再仅仅是堆算力,而是探索强化学习、知识计算、符号推理、类脑计算及其他新型路径。其中投入更小,更垂直的小模型不断涌现。
近年来,大模型发展迅速,以其出色的性能,在语音识别、自然语言处理、图像识别等多个领域取得了显著成果。这些大模型通过深度学习技术,能够处理海量的数据,并从中提取出有价值的特征和信息,为各种应用场景提供强大的支持。特别是在金融、医疗、教育等行业,大模型的应用已经逐渐深入到核心业务领域,成为推动企业创新发展的重要动力。数字化转型网www.szhzxw.cn
然而,大模型的发展也面临着一些挑战。首先,大模型的训练和推理需要消耗大量的计算资源,这使得其成本高昂,且只有少数大型企业能够承担。其次,大模型在处理特定领域的问题时,往往需要大量的数据进行微调,以适应不同的应用场景。此外,随着大模型规模的不断扩大,其可解释性和隐私保护问题也日益凸显。
并且单纯扩大规模,存在幻觉、效率、可信、安全等瓶颈,现在让一个大模型做一个奥数题和计算2+2这样简单的算术题,需要的运算量、运算次数是一样的。所以,我们能否把大模型做得更安全、更高效,更好解决现在存在的一些瓶颈?数字化转型网www.szhzxw.cn
需要指出的是本轮的AI浪潮,核心其实是LLM,即语言大模型——参数量数十亿乃至上百亿,需要专门的GPU集群,训练成本极高——真正能跑出来的产品,无一例外,都是用真金白银堆砌起来的。
但AI显然是要普及的,封闭、资本密集的大模型并不符合这样的大趋势。于是乎,开源的小模型成为了新的热点——大模型的体量,使得它在手机、物联网设备等小型终端上部署起来颇为麻烦,但小模型则不同。尤其是那些要求快速反应的领域,比如语音和图像的识别处理,小模型的处理效率也会更快——某种程度上说,小模型相当于是大模型的精华版。数字化转型网www.szhzxw.cn
相较于大模型,小模型在特定场景下展现出了独特的优势。一是小模型具有较低的计算复杂度和资源消耗,这使得其能够在资源受限的环境下运行,如移动设备、边缘计算节点等。二是小模型往往针对特定任务进行优化,因此在某些应用场景下能够取得与大模型相近甚至更好的性能。三是小模型的可解释性较强,更易于被用户理解和接受。以openai的GPT-4o mini来说,成本下降的情况下,质量反而更高,这就是数据集和训练方式改变后带来的突破。
声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn
数字化转型网人工智能研习社包含哪些内容
数字化转型网人工智能研习社关注人工智能从技术到落地的全方面,包含机器学习算法、深度学习架构、自然语言处理(NLP)技术、计算机视觉技术、AI+医疗健康、AI+交通出行、AI+金融、AI+制造、AI+消费品、AI+互联网、数据隐私和安全、算法公平性、产业生态建设、政策法规制定与完善等。

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于证券之星;编辑/翻译:数字化转型网Jack。



