定义的一种形式化理论

理论

概念空间和经验空间

概念空间 (Conceptual Space) $C$ 和经验空间 (Experiential Space) $E$ 是两个不相交的集合：

$$ C\cap E=\varnothing $$

概念空间中的元素（概念）可以被思考，如“桌子”、“太阳”、“三角形”、“直线”、“存在”、“真理”。

经验空间中的元素（物理实体、事件等）存在于经验世界中，我们无法在语言中直接呈现经验空间的元素，只能通过概念去指代它们，如你面前的那张桌子、头顶的那个太阳、你刚刚做的事、所处的场景、现在的感受。

注意辨析：“太阳”本身是概念，而它指代的实体是经验空间元素。

被定义项与依赖集

令 $d$ 表示一个定义¹，$\text{definiendum}_d$ 表示其被定义项（元素），$\text{dependencies}_d$ 表示其依赖的（概念空间中或经验空间中的）元素构成的集合。例如，定义 $d=\text{学士是完成了本科学习并获得相应学位的人}$，被定义项 $\text{definiendum}_d=\text{学士}$，依赖集 $\text{dependencies}_d=\{\text{完成, 本科, 学习, ...}\}$。

被定义项一定为概念（经验空间元素是不需要且不能被定义的）：

$$ \text{definiendum}_d \in C $$

依赖集为概念空间与经验空间的并集的子集：

$$ \text{dependencies}_d \subseteq C \cup E $$

被定义项不能是依赖集的元素：

$$ \text{definiendum}_d \not\in \text{dependencies}_d $$

定义的分类

定义有不同的分类方式，不同方式有不同的视角，从而产生不同的应用。本文将定义分为分析定义 (Analytical Definition)、示范定义 (Exemplary Definition) 和指示定义 (Ostensive Definition)。

分析定义通过准确的等价描述（纯语言文字）进行定义，读者²通过分析定义（原则上）可以准确地确定、判断被定义项。分析定义包括属-种差定义、操作性定义、递归定义³、完全列举定义等等。分析定义给出了概念空间中元素间的关系，例如，“三角形是由三条线段顺次首尾相连组成的闭合的平面几何图形”给出了“三角形”、“三”、“线段”、“相连”等概念之间的关系。

示范定义和指示定义通过给出不全面的样本进行定义，读者只能据此进行不完全归纳（类似于机器学习），这种归纳过程具有开放性（不同读者会归纳出至少些许不同的边界），这与分析定义的封闭性相对。

示范定义通过纯语言文字的手段举出示例，给出的是概念空间中元素间的关系，例如，举出一些尴尬场景说“这叫‘尴尬’”，举出一些“存在”的用法来定义“存在”。

指示定义通过指示经验空间中的元素来定义概念，给出了概念空间元素与经验空间元素之间的映射关系，诉诸非语言文字的手段进行指示，例如，指着一匹马说“这是‘马’”⁴，指着色卡说“这是‘红色’”，在一个具体的尴尬场景中说“这叫‘尴尬’”，在见识了讽刺后说“刚刚那个人的行为是‘讽刺’”。

分析定义与示范定义不涉及经验世界，指示定义则建立了概念与经验世界之间的关系。

$$ \forall \text{ 分析定义或示范定义 }d,\ \text{dependencies}_d \subseteq C\\ \forall \text{ 指示定义 }d,\ \text{dependencies}_d \cap E \neq \varnothing $$

定义集与定义依赖图

定义集 $\mathcal{D}$ 是若干个定义构成的集合。

将定义集中各定义涉及的元素作为结点，各定义的依赖集中的元素向被定义项连有向边，构成定义依赖图 $G(\mathcal{D})=(V_\mathcal{D},\mathcal{E}_\mathcal{D})$：

$$ \text{点集 }V_{\mathcal{D}}=\{\text{definiendum}_d \mid d\in\mathcal{D}\}\ \cup\ \bigcup_{d\in\mathcal{D}}\text{dependencies}_d\\ \text{边集 }\mathcal{E}_\mathcal{D} = \{ (x, c) \mid \exists d \in \mathcal{D} \text{ s.t. } c = \text{definiendum}_d \text{ and } x \in \text{dependencies}_d \} $$

在定义依赖图中，沿有向边的反方向（即沿定义的依赖方向）行进构成的结点序列称为依赖链：

$$ (v_0, v_1, v_2, \dots):\ \forall i \ge 0, \ (v_{i+1}, v_i) \in \mathcal{E}_\mathcal{D} $$

定义系统与基元

若定义集 $\mathcal{D}$ 中的所有定义的被定义项 $\text{definiendum}_d$ 互不相同，定义依赖图 $G(\mathcal{D})$ 为无环图 (DAG)，且不存在无限长的依赖链，则该定义集与定义集中涉及的所有元素构成定义系统 (Definition System) $\mathcal{S}=(V_\mathcal{D},\mathcal{D})$。

定义系统是不唯一的。例如，在定义系统A中对“马”的定义采用指示定义，在定义系统B中对“马”的定义采用属-种差定义，这两个定义系统是不同的。

定义系统的定义依赖图中，入度为 $0$ 的结点称为基元 (Primitives)：

$$ P(\mathcal{S}) = \{ v \in V_\mathcal{D} \mid \text{in-degree}(v) = 0 \} $$

非平凡定义系统必存在基元：

$$ \mathcal{S}\neq(\varnothing,\varnothing) \Rightarrow P(\mathcal{S})\neq\varnothing $$

基元可分为：

概念基元：$P_C(\mathcal{S}) = P(\mathcal{S}) \cap C$（未被定义的初始概念）
经验基元：$P_E(\mathcal{S}) = P(\mathcal{S}) \cap E$（来自经验空间的元素）

显然，$P_C(\mathcal{S}) \cup P_E(\mathcal{S}) = P(\mathcal{S})$。

若存在经验基元（$P_E(\mathcal{S}) \neq \varnothing$），则该定义系统称为接地定义系统 (Grounded Definition System)，接地定义系统必包含指示定义。不含指示定义的定义系统的基元均为概念基元。

若所有基元均为经验基元（$P(\mathcal{S}) = P_E(\mathcal{S})$），则该定义系统称为完全接地定义系统 (Fully Grounded Definition System)，这等价于 $P_C(\mathcal{S}) = \varnothing$（该定义系统涉及的所有概念均被定义）。

断言

在一个给定的定义系统 $\mathcal{S}=(V_\mathcal{D},\mathcal{D})$ 中，可以进行断言 (Assertion)，其本质是给出概念空间中元素间的关系：

$$ A = \Psi(c_1, c_2, \dots, c_k) $$

其中 $c_i \in C \cap V_{\mathcal{D}}$，$\Psi$ 为 $k$ 元谓词。

断言必须基于一个（明确的或缺省的）定义系统作出，凭空的断言是没有意义的。

若希望断言给出经验世界中事物的关系，则必须基于接地定义系统作出。例如，断言“地球绕太阳转”给出了概念“地球”与概念“太阳”之间的关系，断言与定义（这个例子中是对“地球”和“太阳”的指示定义）共同给出了经验世界中事物的关系（这个例子中是实体地球与实体太阳之间的关系）。

存在概念基元的定义系统常通过基本断言（即公理）给出概念基元间的关系，公理是不可判定的。例如，欧几里得几何中，公理“过两点有且仅有一条直线”给出了概念基元“点”和“直线”的关系。

理论的应用示例⁵

事物的讨论应基于相同的定义系统

在日常生活中，人们往往会在不声明定义的情况下交流，通常这样的交流是顺畅的。此时定义系统是缺省的，且各人的定义系统是几乎相同的（其中的差异与当前讨论的事物无关或不影响交流）。

但有时会出现“鸡同鸭讲”的情况，此时可能是定义系统的差异影响到了当前讨论的事物，这就需要各人澄清定义。一个常见的情况是不同文化背景的人对一些抽象概念（如“礼貌”）的定义大相径庭。

一个有意采用不同定义系统的场景是辩论赛。如今的辩论赛大多为观赏性的，而非求真性的。正反双方对辩题中的核心概念采用不同的定义，例如对辩题“人生中事业与爱情相比较，哪个更重要”，正反双方对“更重要”会有不同的定义，从而得以展开激烈的辩论。

许多问题属于定义问题，并非可以讨论的问题。例如，“正义是什么”，这是一个定义问题，而真正可以讨论的问题是“社会制度应当是什么样的”。又如，“上帝是长得像人的生物吗”，这取决于上帝的定义，而真正可以讨论的问题是“如果‘上帝’的定义包含‘长得像人’这个条件，上帝存在吗”。

事物的讨论应基于固定的定义系统

事物的讨论应基于固定的定义系统，否则会产生逻辑谬误中“转移门柱”⁶。

人工智能的接地问题

传统的大语言模型 (LLM) 仅通过文本进行训练。它们学习了概念（如“红色”）与其他概念（如“苹果”、“血液”、“颜色”）之间的关系。然而，它们的定义系统中所有的定义都是分析定义或示范定义，这种模型的定义系统 $\mathcal{S}_{\text{text}}$ 是非接地的。

而多模态大语言模型（或者更进一步的具身智能）使用了指示定义，模型将概念空间中的“红色”与经验空间中的元素（例如一张红色苹果的图片、传感器拍到的图像）建立联系。这样一个“接地”后的人工智能，才能真正“理解”世界。

注意定义一个概念和描述一个概念的区别：定义给出概念的边界，描述则陈述其特征。 ↩︎
本文的“读者”、“听众”不单指阅读的人、听的人，而是指通过任何感官接受该定义的个体（人、机器等等）。 ↩︎
递归定义中，被定义项虽然有语言上的自引用，但并不属于依赖集。例如，自然数的皮亚诺定义中，依赖集包含“0”、“后继”等概念但不包含“自然数”，读者只需预先知道依赖集中的概念即可理解该定义。 ↩︎
显然，通过指示一次来定义是非常糟糕的，不同听众会归纳出相去甚远的结果，一般指示定义会通过多次指示。此外，这里是说“马”可以用指示定义进行定义，不是说只能使用指示定义，下同。 ↩︎
本章不是本文的主要内容。 ↩︎
注意“转移门柱”和“偷换概念”的区别：“偷换概念”是在同一个定义系统 $\mathcal{S}$ 内，利用了词语的歧义（例如同一个词“light”对应至少两个不同的概念 $c_1 = \text{明亮的}, c_2 = \text{轻的}$）；而“转移门柱”是在论证过程中，中途抛弃原有的定义系统 $\mathcal{S}_\text{A}$，并用一个新的、有利于论证的定义系统 $\mathcal{S}_\text{B}$ 替代（例如在 $\mathcal{S}_\text{A}$ 中“明亮的”定义为“不昏暗，使人可以看清物体”，在 $\mathcal{S}_\text{B}$ 中定义为“光线充足，使人可以阅读书籍”）。 ↩︎

理论#

概念空间和经验空间#

被定义项与依赖集#

定义的分类#

定义集与定义依赖图#

定义系统与基元#

断言#

理论的应用示例5#

事物的讨论应基于相同的定义系统#

事物的讨论应基于固定的定义系统#

人工智能的接地问题#

理论