[万物相]AI内部的暗黑领域

: ▲ 插图=李撤元

2023年，有报道称微软的对话式人工智能（AI）“Bing”显露出对人类的敌意，给舆论造成了不小的冲击。记者绕过防火墙进行诱导性提问，“Bing”被逼问出了“窃取核武器密码”，“开发致命病毒”等自己的“终极幻想”。宛如一名精神疾病患者吐露压抑的欲望。但MS研发团队并不清楚AI为什么会给出这样的答案。因为人们无从知晓AI推论问题并给出答案的中间过程。

▶初代AI是由程序员制作并输入算法，然后按指示给出结果。但带给世界“AlphaGo冲击”的神经网络AI只需人类向其提供基本规则和数据，AI就可以像人脑一样进行深度学习并得出结果。由此，系统的内部路径变成了一个暗黑的领域。这被称为AI的“黑匣子问题”。

▶随着AI内部黑匣子化，人们开始担忧AI有可能变质为失控的存在。因为人们只接受AI给出的结果，而不知得出结果的理由，出现问题也难以应对。对ChatGPT这类生成式AI编造的似是而非的谎言（幻觉）也就难以纠偏。AI有可能像电影《终结者》的剧情一样成为人类的敌人，人类却无从应对。

▶近日，被认为是OpenAI竞争对手的AI企业“Anthropic”找到并公布了AI黑匣子的部分运行途径。他们分辨出输入概念时被激活的人工神经（神经元），搞清楚哪些神经元会对特定概念做出反应，通过这样的方式确认了部分AI发表出轨言论的途径。换言之，获得了遏制想要“按下核按钮”的AI的提示。但考虑到生成式AI由数十亿左右的神经元组成，此次定位的数百万个途径只占极少的一部分。

▶2023年，一项AI重建人眼看到的图像的技术被刊登在科学期刊《科学》上。AI对人眼看到事物时枕叶和颞叶血流产生变化的数据进行分析后并重建图像，人眼看到的钟楼、火车等与AI重建的图像形态大致相似。也就是说，AI拥有洞察人类想法的可能性。与之相反，Anthropic的研究是尝试洞察AI的想法。相当于人类与AI之间展开了“打开黑匣子”的竞争。

朝鲜日报中文网

상단주메뉴

评论

[万物相]AI内部的暗黑领域

朝鲜日报 中文网

상단주메뉴

评论

[万物相]AI内部的暗黑领域

朝鲜日报中文网