技术
首页  >  技术  >  技术要闻

人工智能的“觉醒”从语言开始 AI语言学原理与动态词典3.0

2018-05-24  来源:中国信息产业网-人民邮电报  作者:史雷鸣

智能是语言学问题

语言是世界的本质

世界之所以能被描述,是因为其具有可被测量观察的属性和变量,形成了现象。当人类观察和定义这种现象及其变量,创建了媒体符号予以指征,便形成了媒体语言。与之相对应,被指征的存在的事物,就是自身的语言。这种存在以能量和物质的方式构成了世界,它们是实在的物的语言,我们可以称之为物语。人类构建的文字、音乐、绘画、雕塑等语言,依赖于媒体表达,我们可以称之为媒语。计算机代码也是一种媒语。其构成基础的0和1,可以用电,也可以用磁,还可以用光作为载体和媒体。

所有的语言都是符号系统,语言学的基础是符号学。符号学将符号分为符形和符意两个部分。符形是它的形式或者载体,符意是其携带或者指征的意义。自然存在的事物也是自身的符号,其存在的物质能量形式本身就是符形,其属性或者所具备的物理、化学特性就是符意。人类对自然的研究,是不断地对自然存在进行拆分、解读和破译,不断地创造新的媒语指征揭示所对应的物语。例如原子、电子、夸克等。自然科学是对世界的解读和使用媒语构建的语言学模型和地图。

知识即语言

人类的知识体系主要由文字语言、图表、公式、数字构建而成。图表公式和数字是一些特殊的符号语言。还有一些知识,存在于文化和习惯中,以及口语与记忆中,或者存在于经验中,它们也是一种符号体系,只不过没有被提取或者整理成严密和公共化的语言体系。即使是模糊的经验、工艺流程、行为,甚至我们的思考都是一种程序。程序本身就是一个语言序列。动物的行为、植物的生长代谢,都是一种或者多种程序的混合。因此,人类所有的知识都是语言或者类语言。

正因为人类创造了媒语,可以将很多经验、认识用媒体语言记录和传播,因此成为知识汇集、记录、转载、传播的知识池,这种可以高效记录和传播的外部媒体载体语言,成为人类大脑和意识的外部存储器、网络、输入与输出设备,甚至外部的计算器,大大促进了人类的文化和文明的发展。

智能是语言的产物

人类和原始人存在着巨大的智力差别。原始人和现代人的孩子在出生时其实差别甚小,或者说现代人出生的时候其实就是一个原始人甚至是一只“小野兽”。一万年前人类的大脑容量比现代人更大,两者后天的差异是造成智力差别的核心原因,经历和受教育的差异构成了智力的差异。现代人所受的教育,核心是体验和词语化。受教育的过程就是一个构建词库、扩充词库和不断强化优化词语之间的关联性和解释关系的过程和体验。智能,取决于你认识多少事物,掌握多少词语,以及词语之间的关系构建和它们之间的解释关系的差异。

人类的思考是以文字和图表为主要方式进行的。图表是另外一种特殊的语言和符号系统。语言是一个演进、累积逐步构建的系统,有其最初的简单的源自世界的自然现象及其变化和变量的原型。最初的语言不过是对最基础的自然现象特征以及变量和变化的指征。在此基础上,人类不断细分现象及其变量,发现最初的朴素的逻辑,并以此为基础不断扩展。人类整体的智力也伴随着这个语言和词语库的发展而发展。物理学、化学等其实是特殊的细致的专门词典。

关键词:语言 拓扑关系 语言规律 觉醒 多叉树