理论
概念空间和经验空间
概念空间 (Conceptual Space) $C$ 和经验空间 (Experiential Space) $E$ 是两个不相交的集合:
$$ C\cap E=\varnothing $$概念空间中的元素(概念)可以被思考,如“桌子”、“太阳”、“三角形”、“直线”、“存在”、“真理”。
经验空间中的元素(物理实体、事件等)存在于经验世界中,我们无法在语言中直接呈现经验空间的元素,只能通过概念去指代它们,如你面前的那张桌子、头顶的那个太阳、你刚刚做的事、所处的场景、现在的感受。
注意辨析:“太阳”本身是概念,而它指代的实体是经验空间元素。
被定义项与依赖集
令 $d$ 表示一个定义1,$\text{definiendum}_d$ 表示其被定义项(元素),$\text{dependencies}_d$ 表示其依赖的(概念空间中或经验空间中的)元素构成的集合。例如,定义 $d=\text{学士是完成了本科学习并获得相应学位的人}$,被定义项 $\text{definiendum}_d=\text{学士}$,依赖集 $\text{dependencies}_d=\{\text{完成, 本科, 学习, ...}\}$。
被定义项一定为概念(经验空间元素是不需要且不能被定义的):
$$ \text{definiendum}_d \in C $$依赖集为概念空间与经验空间的并集的子集:
$$ \text{dependencies}_d \subseteq C \cup E $$被定义项不能是依赖集的元素:
$$ \text{definiendum}_d \not\in \text{dependencies}_d $$定义的分类
定义有不同的分类方式,不同方式有不同的视角,从而产生不同的应用。本文将定义分为分析定义 (Analytical Definition)、示范定义 (Exemplary Definition) 和指示定义 (Ostensive Definition)。
分析定义通过准确的等价描述(纯语言文字)进行定义,读者2通过分析定义(原则上)可以准确地确定、判断被定义项。分析定义包括属-种差定义、操作性定义、递归定义3、完全列举定义等等。分析定义给出了概念空间中元素间的关系,例如,“三角形是由三条线段顺次首尾相连组成的闭合的平面几何图形”给出了“三角形”、“三”、“线段”、“相连”等概念之间的关系。
示范定义和指示定义通过给出不全面的样本进行定义,读者只能据此进行不完全归纳(类似于机器学习),这种归纳过程具有开放性(不同读者会归纳出至少些许不同的边界),这与分析定义的封闭性相对。
示范定义通过纯语言文字的手段举出示例,给出的是概念空间中元素间的关系,例如,举出一些尴尬场景说“这叫‘尴尬’”,举出一些“存在”的用法来定义“存在”。
指示定义通过指示经验空间中的元素来定义概念,给出了概念空间元素与经验空间元素之间的映射关系,诉诸非语言文字的手段进行指示,例如,指着一匹马说“这是‘马’”4,指着色卡说“这是‘红色’”,在一个具体的尴尬场景中说“这叫‘尴尬’”,在见识了讽刺后说“刚刚那个人的行为是‘讽刺’”。
分析定义与示范定义不涉及经验世界,指示定义则建立了概念与经验世界之间的关系。
$$ \forall \text{ 分析定义或示范定义 }d,\ \text{dependencies}_d \subseteq C\\ \forall \text{ 指示定义 }d,\ \text{dependencies}_d \cap E \neq \varnothing $$定义集与定义依赖图
定义集 $\mathcal{D}$ 是若干个定义构成的集合。
将定义集中各定义涉及的元素作为结点,各定义的依赖集中的元素向被定义项连有向边,构成定义依赖图 $G(\mathcal{D})=(V_\mathcal{D},\mathcal{E}_\mathcal{D})$:
$$ \text{点集 }V_{\mathcal{D}}=\{\text{definiendum}_d \mid d\in\mathcal{D}\}\ \cup\ \bigcup_{d\in\mathcal{D}}\text{dependencies}_d\\ \text{边集 }\mathcal{E}_\mathcal{D} = \{ (x, c) \mid \exists d \in \mathcal{D} \text{ s.t. } c = \text{definiendum}_d \text{ and } x \in \text{dependencies}_d \} $$在定义依赖图中,沿有向边的反方向(即沿定义的依赖方向)行进构成的结点序列称为依赖链:
$$ (v_0, v_1, v_2, \dots):\ \forall i \ge 0, \ (v_{i+1}, v_i) \in \mathcal{E}_\mathcal{D} $$定义系统与基元
若定义集 $\mathcal{D}$ 中的所有定义的被定义项 $\text{definiendum}_d$ 互不相同,定义依赖图 $G(\mathcal{D})$ 为无环图 (DAG),且不存在无限长的依赖链,则该定义集与定义集中涉及的所有元素构成定义系统 (Definition System) $\mathcal{S}=(V_\mathcal{D},\mathcal{D})$。
定义系统是不唯一的。例如,在定义系统A中对“马”的定义采用指示定义,在定义系统B中对“马”的定义采用属-种差定义,这两个定义系统是不同的。
定义系统的定义依赖图中,入度为 $0$ 的结点称为基元 (Primitives):
$$ P(\mathcal{S}) = \{ v \in V_\mathcal{D} \mid \text{in-degree}(v) = 0 \} $$非平凡定义系统必存在基元:
$$ \mathcal{S}\neq(\varnothing,\varnothing) \Rightarrow P(\mathcal{S})\neq\varnothing $$基元可分为:
- 概念基元:$P_C(\mathcal{S}) = P(\mathcal{S}) \cap C$(未被定义的初始概念)
- 经验基元:$P_E(\mathcal{S}) = P(\mathcal{S}) \cap E$(来自经验空间的元素)
显然,$P_C(\mathcal{S}) \cup P_E(\mathcal{S}) = P(\mathcal{S})$。
若存在经验基元($P_E(\mathcal{S}) \neq \varnothing$),则该定义系统称为接地定义系统 (Grounded Definition System),接地定义系统必包含指示定义。不含指示定义的定义系统的基元均为概念基元。
若所有基元均为经验基元($P(\mathcal{S}) = P_E(\mathcal{S})$),则该定义系统称为完全接地定义系统 (Fully Grounded Definition System),这等价于 $P_C(\mathcal{S}) = \varnothing$(该定义系统涉及的所有概念均被定义)。
断言
在一个给定的定义系统 $\mathcal{S}=(V_\mathcal{D},\mathcal{D})$ 中,可以进行断言 (Assertion),其本质是给出概念空间中元素间的关系:
$$ A = \Psi(c_1, c_2, \dots, c_k) $$其中 $c_i \in C \cap V_{\mathcal{D}}$,$\Psi$ 为 $k$ 元谓词。
断言必须基于一个(明确的或缺省的)定义系统作出,凭空的断言是没有意义的。
若希望断言给出经验世界中事物的关系,则必须基于接地定义系统作出。例如,断言“地球绕太阳转”给出了概念“地球”与概念“太阳”之间的关系,断言与定义(这个例子中是对“地球”和“太阳”的指示定义)共同给出了经验世界中事物的关系(这个例子中是实体地球与实体太阳之间的关系)。
存在概念基元的定义系统常通过基本断言(即公理)给出概念基元间的关系,公理是不可判定的。例如,欧几里得几何中,公理“过两点有且仅有一条直线”给出了概念基元“点”和“直线”的关系。
理论的应用示例5
事物的讨论应基于相同的定义系统
在日常生活中,人们往往会在不声明定义的情况下交流,通常这样的交流是顺畅的。此时定义系统是缺省的,且各人的定义系统是几乎相同的(其中的差异与当前讨论的事物无关或不影响交流)。
但有时会出现“鸡同鸭讲”的情况,此时可能是定义系统的差异影响到了当前讨论的事物,这就需要各人澄清定义。一个常见的情况是不同文化背景的人对一些抽象概念(如“礼貌”)的定义大相径庭。
一个有意采用不同定义系统的场景是辩论赛。如今的辩论赛大多为观赏性的,而非求真性的。正反双方对辩题中的核心概念采用不同的定义,例如对辩题“人生中事业与爱情相比较,哪个更重要”,正反双方对“更重要”会有不同的定义,从而得以展开激烈的辩论。
许多问题属于定义问题,并非可以讨论的问题。例如,“正义是什么”,这是一个定义问题,而真正可以讨论的问题是“社会制度应当是什么样的”。又如,“上帝是长得像人的生物吗”,这取决于上帝的定义,而真正可以讨论的问题是“如果‘上帝’的定义包含‘长得像人’这个条件,上帝存在吗”。
事物的讨论应基于固定的定义系统
事物的讨论应基于固定的定义系统,否则会产生逻辑谬误中“转移门柱”6。
人工智能的接地问题
传统的大语言模型 (LLM) 仅通过文本进行训练。它们学习了概念(如“红色”)与其他概念(如“苹果”、“血液”、“颜色”)之间的关系。然而,它们的定义系统中所有的定义都是分析定义或示范定义,这种模型的定义系统 $\mathcal{S}_{\text{text}}$ 是非接地的。
而多模态大语言模型(或者更进一步的具身智能)使用了指示定义,模型将概念空间中的“红色”与经验空间中的元素(例如一张红色苹果的图片、传感器拍到的图像)建立联系。这样一个“接地”后的人工智能,才能真正“理解”世界。
-
注意定义一个概念和描述一个概念的区别:定义给出概念的边界,描述则陈述其特征。 ↩︎
-
本文的“读者”、“听众”不单指阅读的人、听的人,而是指通过任何感官接受该定义的个体(人、机器等等)。 ↩︎
-
递归定义中,被定义项虽然有语言上的自引用,但并不属于依赖集。例如,自然数的皮亚诺定义中,依赖集包含“0”、“后继”等概念但不包含“自然数”,读者只需预先知道依赖集中的概念即可理解该定义。 ↩︎
-
显然,通过指示一次来定义是非常糟糕的,不同听众会归纳出相去甚远的结果,一般指示定义会通过多次指示。此外,这里是说“马”可以用指示定义进行定义,不是说只能使用指示定义,下同。 ↩︎
-
本章不是本文的主要内容。 ↩︎
-
注意“转移门柱”和“偷换概念”的区别:“偷换概念”是在同一个定义系统 $\mathcal{S}$ 内,利用了词语的歧义(例如同一个词“light”对应至少两个不同的概念 $c_1 = \text{明亮的}, c_2 = \text{轻的}$);而“转移门柱”是在论证过程中,中途抛弃原有的定义系统 $\mathcal{S}_\text{A}$,并用一个新的、有利于论证的定义系统 $\mathcal{S}_\text{B}$ 替代(例如在 $\mathcal{S}_\text{A}$ 中“明亮的”定义为“不昏暗,使人可以看清物体”,在 $\mathcal{S}_\text{B}$ 中定义为“光线充足,使人可以阅读书籍”)。 ↩︎
浙公网安备33028202000901