我国人工智能的现状与思考

人工智能（Artificial Intelligence），英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

人工智能的主流技术发展大致经历了三个重要的历程：

第一阶段：1950-1970年代，人工智能的“推理时代”。这一时期，一般认为只要机器被赋予逻辑推理能力就可以实现人工智能。不过此后人们发现，只是具备了逻辑推理能力，机器还远远达不到智能化的水平。

第二阶段：1970-1990年代，人工智能的“知识工程”时代。这一时期，人们认为要让机器变得有智能，就应该设法让机器学习知识，于是专家系统得到了大量的开发。

第三阶段：2000年至今，人工智能的“数据挖掘”时代。随着各种机器学习算法的提出和应用，特别是深度学习技术的发展，人们希望机器能够通过大量数据分析，从而自动学习出知识并实现智能化水平。

目前，人工智能在许多领域都得到了应用，其应用领域如下：

（一）在医学领域中的应用。人工智能在国外发展很快，在医学方面取得了很大的成就。国外最早将人工智能成功应用于医疗诊断的是MYCIN专家系统。美国及其他发达国家的科学家已成功研制出了用于人类血管治疗的微型机器人。20世纪80年代初，我国已成功将人工智能应用于医学，且在这方面有了新的突破，例如许多高等院校和研究机构共同开发了基于人工智能的医学计算机专家系统，并成功地应用于临床。

（二）在矿业中的应用。第一个将人工智能专家系统应用于矿业的是美国的专家系统PROSPECTOR，该系统用于勘探评价、区域资源估值和钻井井位选择等等，为矿业的开采带来了方便。1980年以来，美国的矿业公司在人工智能上加大了投资，其中矿山局匹兹堡研究中心与其它单位合作开发了用于煤矿开发的专家系统。

（三）在电子技术方面的应用。人工智能在电子技术领域的应用由来已久。随着网络的迅速发展，网络问题日益突出，网络技术的安全成了我们关心的重点。因此在传统技术的基础上进行网络安全技术的改进，大力发展挖掘技术、免疫技术，以及开发智能机器，人工智能技术在这方面为我们提供了可能性。

（四）在技术研究中的应用。人工智能在技术研究中的应用，首先是应用于超声无损检测与无损评价领域。在超声无损检测与无损评价领域，目前主要广泛采用专家系统对超声损伤中缺陷的性质，大小和形状进行判断和归类。此应用节省了许多人力，另外这些技术的应用，使得无损检测的定位、定性和定量的可靠性有了大幅度提高，为无损评价奠定了良好的判定基础。

除了以上这些领域，人工智能已经渗透到了我们生活的方方面面。在2021年小米秋季新品发布会上，发布了一款仿生机器人CyberDog，格外引人注目。这款概念产品叫CyberDog，中文名“铁蛋”，售价为9999元。同时雷军还宣布，小米成立了机器人实验室。从充满科幻感的波士顿动力研发的机器人士兵和大狗，到2021年春晚“机器牛”群演，无一不说明这种新事物已经不再遥远。

“铁蛋”搭载了NVIDIA JETSON XAVIER NX平台作为数据处理终端，这决定了“铁蛋”的感知能力并不弱，可以同时处理身体上多个传感器发来的信号，“铁蛋”身上起码配置了11个传感器，这对处理终端要求十分高，而传感器和处理终端的配合决定了“铁蛋”是否能模仿生物的环境感知能力和分析处理能力。

“铁蛋”的空间感知能力来自小米手机的影像技术，比如“铁蛋”的自主跟随能力就是源自人脸识别技术的衍生，以及SLAM建图和导航避障功能都来自影像技术的延伸的视觉探知技术，“铁蛋”通过影像技术感知环境后，通过算法创建出地图并导航，最终规划出最优路线。另外“铁蛋”还具有丰富的延展能力，全身配备了1个HDMI接口和3个Type-C接口，这些接口可以接入相机、灯具、激光雷达等扩展设备，让“铁蛋”具有更多种应用场景。而“铁蛋”分析用户指令的技术来自小米的明星产品“小爱同学”等智能生态，用户可以通过语音向“铁蛋”下达指令唤醒“铁蛋”，并让“铁蛋”做出行动。目前的小米智能生态已经覆盖八大应用场景和72个品类。

我们再来看国内另一家知名企业华为技术有限公司。2021年4月，华为云发布了盘古系列超大预训练模型，包括中文语言（NLP）、视觉（CV）大模型，多模态大模型、科学计算大模型。华为云盘古大模型旨在建立一套通用、易用的人工智能开发工作流，以赋能更多的行业和开发者，实现人工智能工业化开发。

华为云一直认为，AI应该具备普惠属性，不应该待在象牙塔，而应该面向千行百业。传统的AI开发模式，有点像是“小作坊模式”，即针对每个场景，独立地完成模型选择、数据处理、模型优化、模型迭代等一系列开发环节。由于无法积累通用知识，同时不同领域的调试方法有所不同，这样的开发模式往往比较低效。盘古大模型最大的价值就是打造了一种全新的“工业化开发模式”。将一套通用的流水线复用到各种不同的场景里去，减少专家的干预和人为调优的消耗，从而降低人工智能开发的门槛和成本。

目前，盘古目前的预训练模型包括了四个大的“分身”：

第一，文本大模型（NLP）重点在于文本的理解和生成能力，可以理解文字背后的含义，从文本中抽取关键信息，例如从法律文书中快速找出案件要素，提高判决效率，也可以辅助人类写作；

第二，视觉大模型（CV）重点在于视觉理解的能力，可以对各行业的图像进行识别和检测，例如快速找出工业产品的缺陷，提高质检效率；

第三，多模态大模型重点在于图像和文本的跨模态理解与生成能力，可以根据给定的文本生成图像，也可以根据给定的图像生成文本，可以帮助人类提高产品设计和艺术创作的效率；

第四，科学计算大模型的目标是帮助人类解决各种科学问题，如气象预测、海浪预测、分子动力学预测、微分方程求解等，用AI技术来促进基础科学的发展。

目前盘古预训练大模型已经在多个行业、多个场景成功验证，包括能源、零售、金融、工业、医疗、环境、物流等等。例如，在能源领域，盘古预训练大模型帮助行业客户实现设备能耗的智能控制，可以节约电力成本50%；在金融行业中的异常财务检测，让模型精度提升20%以上。

在人工智能技术方面有一个很突出的现实问题，智能机器人的核心零件中国目前仍需要大量进口解决，比如机器人生产所需要的减速器、控制器、伺服电机等等，进口比例甚至超过了80%，这对仿生机器人的应用并不是什么好消息。深度学习开源框架领域的一个既定事实是，TensorFlow、PyTorch基本两分天下，从技术能力到生态建设，它们能给AI落地提供有力支撑，可以满足大部分企业在其中构建自己的AI应用。反观国产AI开源框架，即便百度PaddlePaddle已开源五年，腾讯Angel、阿里X-DeepLearning等框架也相继开源，但从市场影响力和使用规模来看，还难与前两者抗衡。

对于AI基础设施的建设，中国政府在《新一代人工智能发展规划》等关于AI顶层规划的政策中都着重提及，除了加大应用层技术落地，更希望业界和学界深入AI底层技术研发。基础技术的“卡脖子”话题成为近两年中国科技界探讨的热点，担心中国AI的发展会像芯片发展那样遭遇空中楼阁的困境。而以高文院士为代表的AI专家也在四处布道“做人工智能必须要做开源，中国要想发展好新一代的人工智能，必须要有高效和风险可控的开源开放平台”的观点。对有雄心发展AI的企业或者国家来说，通过自主研发来掌握AI底层技术无疑是一项重大战略。

我国人工智能开源社区和技术创新生态布局相对滞后，技术平台建设力度有待加强。我们要以问题为导向，主攻关键核心技术，加快建立新一代人工智能关键共性技术体系，全面增强人工智能科技创新能力，确保人工智能关键核心技术牢牢掌握在自己手里。要着力防范人工智能时代“空心化”风险，系统布局并重点发展人工智能领域的“新核高基”：“新”指新型开放创新生态，如产学研融合等；“核”指核心关键技术与器件，如先进机器学习技术、鲁棒模式识别技术、低功耗智能计算芯片等；“高”指高端综合应用系统与平台，如机器学习软硬件平台、大型数据平台等；“基”指具有重大原创意义和技术带动性的基础理论与方法，如脑机接口、类脑智能等。同时，我们要重视人工智能技术标准的建设、产品性能与系统安全的测试。特别是我国在人工智能技术应用方面走在世界前列，在人工智能国际标准制定方面应当掌握话语权，并通过实施标准加速人工智能驱动经济社会转型升级的进程。

总之，在探索发展人工智能的战略进程中，中国需要清楚地认识到，科技产业正在快速全球化。从基础研究到应用开发，再到硬件生产，人工智能全产业链的各个环节都包含着大量的国际合作。在建设自己的数据生态系统、培养数据科学和研发人才，以及打造半导体产业的同时，中国还需要将其人工智能产业建设成为一个与全球市场融合的开放系统。

（山西省信息产业技术研究院有限公司高宇琦）

<上一篇