PHIL 145: 批判性思维

Estimated study time: 1 hr 59 min

Table of contents

批判性思维是一门关于如何评估论证的课程。我们学习的不仅是识别好与坏的论证，更重要的是培养一种开放而有据可依的思维方式——既有自信去质疑，也有勇气在面对充分证据时改变自己的立场。

第一讲：导论——什么是批判性思维？

我们生活在一个信息以指数速度膨胀的时代：每天涌向我们的主张数量，早已超越任何个人所能仔细核查的阈值。正是在这样的背景下，批判性思维不再只是哲学课堂的奢侈练习，而变成了一种基本的认知自卫能力——它帮助我们在信息洪流中辨别哪些主张值得信赖，哪些正在悄悄地操控我们的判断。

批判性思维（critical thinking）是对信念进行理性评估的过程。它的核心在于：我们接受一个主张，应当基于充分的理由（reasons），而非情感、习惯或权威。这听起来简单，实践中却远非如此——大多数时候，我们接受或拒绝一个观点，靠的是直觉、感情，或是对提出这个观点的人的信任程度，而非对论证本身的仔细考察。批判性思维要做的，正是把这个潜意识的评估过程拉到意识层面，赋予它明确的规则和工具。

这门学科的根，深扎在苏格拉底公元前5世纪的雅典。苏格拉底一生没有写下一字，留下的是一种对话方式——他称之为"诘问法"（elenchus）：通过一问一答，层层追究对方所持观点的根据，直到暴露出其中的内在矛盾。苏格拉底并不声称自己拥有真理，他的贡献在于揭示：大多数人对自己最深信不疑的事情，其实从未经过严肃的检验。这种揭露让他在雅典树敌无数，最终以"败坏青年道德"的罪名被判处死刑——历史上最著名的以言获罪案例之一。但他的方法留了下来，成为两千年西方哲学的核心遗产。

批判性思维课程关注的核心对象是论证（argument）。一个论证由两部分构成：

前提（premises）：支持结论的理由
结论（conclusion）：论证试图确立的主张

论证与解释（explanation）不同：论证的目的是说服某人接受某个主张，而解释的目的是说明某个已知事实为何如此。这一区别看似细微，却在实践中至关重要。当一个朋友说"我今天没来上课，因为我生病了"，他是在解释一个已知的事实（他缺席），而非试图说服你接受某个你本来不相信的结论。但当同一个人说"你应该接种流感疫苗，因为疫苗能降低感染风险"，这便是一个论证：前提（疫苗降低感染风险）被用来支持一个你可能持保留态度的结论（你应该接种）。

为什么要学批判性思维？

教授给出了三条理由，彼此并不重叠。第一条是公民身份的要求：民主制度要求公民评估政客、政策、媒体的论证，而不只是跟随党派标签或情绪；如果选民无法识别糟糕的论证，民主就会退化为口号的竞争。第二条是学术和职业工作：几乎所有需要严肃判断的领域——医学、法律、工程、商业——都要求从业者能够在不确定条件下构建和评估论证。第三条，也是最个人化的：逻辑自卫（logical self-defense）——广告商、政客、推销员每天对我们使用数十种论证策略，不具备识别这些策略的能力，就等于手无寸铁地进入战场。

这门课最恰当的类比，不是"学会一套公式"，而是"学会开车"。在开车之前，你有一套隐性的直觉，但一旦学了交通规则、掌握了换挡技巧，你驾驶时的决策质量就会提升——不是因为你每次都要逐条查规则，而是因为那些规则已经内化为清晰的判断框架。批判性思维的目标相同：不是在每次对话中画谬误清单，而是建立一种持续的理性敏感性，让好的推理习惯变成第二直觉。

主张的类型

语言的丰富性有时会模糊我们的判断。并非所有句子都构成主张。只有陈述句（declarative sentences）才能被评估为真或假，才可以在论证中充当前提或结论。疑问句、命令句、感叹句本身不是主张，但可以在语境中隐含主张——“你难道不觉得这样做是错的？“表面上是疑问，实则在暗示"这样做是错的"这一陈述。

主张可分为两大类，它们在评估方式上存在根本差异：

事实主张（factual claims）：关于世界状况的陈述，可通过经验检验。“北京2023年的年均气温是13.5℃"——这个主张有明确的检验标准，对与错可以被调查确定。
价值主张（value claims）：关于好坏、对错的评价，更难用单纯的经验来验证。“经济增长比环境保护更重要”——这个主张涉及价值排序，单靠数据本身无法裁决，背后预设了一套关于"什么是重要的"的伦理立场。

区分这两类主张，是论证分析的第一步：它能帮助我们判断争论到底发生在哪个层次。有时两方吵了半天，其实在争论不同层次的问题——一方在谈事实，另一方在谈价值——这种层次的错位，本身就是逻辑混乱的重要来源。

第二讲：识别论证

从自然语言中识别论证，远比听起来困难。日常话语是模糊的、情绪化的、语境依赖的；而论证分析要求我们在这片噪音中，找出那些具有真正"支持-结论"结构的推理链条。这项技能像侦探工作多于像代数：没有机械公式，需要的是对语言线索的系统性敏感。

要从日常语言中识别论证，关键是找到论证指示词（argument indicators）。这些词汇在语言中扮演路标的角色，标记出推理的方向。

结论指示词

“因此”、“所以”、“故而”、“由此可知”、“这说明”（therefore, thus, hence, it follows that, so）

前提指示词

“因为”、“由于”、“鉴于”、“原因是”（because, since, given that, for, as）

注意事项

指示词是有用的线索，但绝非万能。语言的弹性意味着同一个词在不同语境中承担着截然不同的功能。并非所有含"因为"的句子都是论证。“我迟到了，因为堵车"是解释，不是论证（迟到这一事实已知，“因为"在解释原因）。真正区分论证与解释的，不是用了哪个词，而是说话人的意图：论证试图让你相信一个你本来可能不接受的结论，而解释假设结论已经成立，只是补充"为什么”。

中文的修辞传统使这个挑战更加复杂。中国古典散文——尤其是先秦诸子——往往以类比、例证和意象代替明确的逻辑步骤，论点通过叙事和比喻渐渐浮现，而非通过前提-结论的线性排列呈现。孟子论证仁政时，讲梁惠王见牛赴宰场的不忍之心——这是一个论证，但其力量来自于触动情感与类比联想，逻辑骨架隐藏在生动叙事之下。识别这类论证需要更多的诠释工作。

隐含前提（implicit premises）：论证中经常省略被认为显而易见的前提。批判性思维要求我们将这些隐含前提明确化，以便评估。例如"小张是医生，所以他肯定聪明”——这个论证隐含了"所有医生都很聪明"这一前提。将它明确化之后，我们可以问：这个前提真的成立吗？它能成为普遍规律吗？隐含前提往往正是论证中最容易偷运问题的部分：论证者正是靠着不把它们说出来，避免了检验。

慈善原则（Principle of Charity）：在标准化论证时，应当将作者的立场解读得尽可能合理（as rational as possible）。这不是无原则的好意，而是方法论上的要求：如果我们攻击一个刻意歪曲的稻草人版本，即使赢了辩论，也没有真正推进理解。慈善解读要求我们问：在给定语境中，对这段话最强的合理诠释是什么？只有批评最强的版本，批判才有真正的认知价值。一个实践规则：当一段文字在字面上有多种解读时，选择让作者的论证看起来最合理的那种——除非有明确证据表明作者意图的是更弱的版本。

第三讲：复杂论证分析

现实世界中的论证很少是两行就能写完的简单推理。一篇法庭辩论词、一份政策倡议书、一部哲学著作，都是由层叠交织的推理链条构成的——有些前提本身需要论证，有些结论同时充当着更大论证的前提，有些理由相互配合才能发挥作用，另一些则彼此独立。掌握复杂论证的分析技术，才能真正"看穿"一篇文章到底在做什么。

论证结构

论证可能层层嵌套，形成具有内在层级的推理树：

主结论（main conclusion）：整个论证的最终目标
子结论（sub-conclusion）：同时作为某些前提的结论，又作为支持主结论的前提

考虑一个典型的政策论证结构：“政府应该加大对新能源汽车的补贴。（主结论）……因为新能源汽车能减少碳排放（子结论/前提A），而减少碳排放对应对气候变化至关重要（深层前提）；此外，新能源产业能创造大量就业（子结论/前提B），而就业增长对经济稳定有益（深层前提）。“这里，“减少碳排放"和"创造就业"各自既是需要被证明的结论，又是支持"应加大补贴"的前提——这就是子结论。

论证图示（argument mapping）是可视化论证结构的工具，用箭头表示支持关系。这种工具不只是帮助分析他人的论证，也是检验自己推理的利器：当你试图将一段话画成论证图时，会立刻发现哪些连接是跳跃的，哪些环节其实没有支撑。

聚合支持 vs. 独立支持

理解多个前提如何共同支持一个结论，需要区分两种根本不同的结构——这个区别在评估论证时至关重要：

聚合（linked/convergent）：多个前提共同构成一个推理链，缺少任一前提则论证明显减弱。这类前提彼此依赖，需要"打包"评估。典型例子是三段论：P1（所有人都会死）+ P2（苏格拉底是人）→ C（苏格拉底会死）。拿走任何一个前提，结论就无从成立。
独立（independent/divergent）：多个前提各自独立地支持结论，任何一个成立都能对结论提供一定支持。这类结构就算一个前提被否定，结论仍然可能获得其他前提的支持。道德论证常见这种结构：“你不应该撒谎，因为这对被骗者造成伤害（前提A，独立）；也因为撒谎腐蚀信任关系（前提B，独立）；还因为你希望别人也不要欺骗你（前提C，独立）。“否定其中一条，并不消灭另外两条的支持力量。

区分这两种结构，对于"如何攻击一个论证"有着直接的实践意义：对聚合前提的论证，只需否定一个前提便可瓦解整体；对独立前提的论证，则必须逐一击破每个前提，否则结论仍然有一定支撑。

论证标准化程序

在标准化一个论证（将其从散乱的自然语言整理为清晰的前提-结论形式）时，需要关注结论的范围（scope of the conclusion）：论证的范围有多大？是关于"所有X”、“大多数X”、“某些X”，还是"至少有一个X”？标准化应当忠实于原作者意图的范围，不要扩大（将"大多数"标准化为"所有”），也不要缩小（将一个普遍主张标准化为个案主张）。

对于隐含前提的处理，标准化应引入最弱的能使论证有效（或足够强）的前提版本。引入的隐含前提要满足两个条件：(1) 它能让论证形式更合理；(2) 在慈善解读下，原作者会合理地接受它。永远不要引入原作者不会接受的前提，然后据此批评论证——这就变成了稻草人谬误。

第四讲：论证评估标准

亚里士多德在《前分析篇》中，第一次将论证的评估拆解为两个相互独立的维度。这个两千多年前的发现，至今仍是批判性思维的核心支柱之一——它能帮助我们精准地定位一个论证究竟在哪里出了问题。在实践中，许多人把这两个维度混为一谈：他们要么因为不接受某个前提便否定整个论证的推理结构，要么因为推理严谨便轻易接受了错误的前提。将这两个维度分开，是清晰评估论证的先决条件。

评估一个论证，需要检验两个独立维度：

1. 推理有效性

演绎有效性（deductive validity）：若所有前提为真，则结论必然为真。这是一种关于前提与结论之间逻辑关系的主张，与前提是否实际为真无关。

有效性与真实性的分离，是现代逻辑最重要的洞见之一。考虑这个论证：“所有鱼都会飞；鲤鱼是鱼；所以鲤鱼会飞。“这是一个完全有效的论证——如果前提为真，结论就必然为真。但前提是假的，所以结论也是假的。有效性与真实性是两个独立的问题，必须分开评估。

归纳强度（inductive strength）：若所有前提为真，则结论很可能为真。归纳论证不能保证结论，只能提供程度不一的支持。

归纳论证的强弱是连续的，而非二元的：同样的前提集，支持某结论的力度可以是"极可能”、“相当可能”、“略有可能”，随着新证据的加入而动态变化。这正是科学推理的特征——没有任何实验结论在逻辑上是"证明"的，但证据累积到一定程度后，结论的可信度足以支撑行动。

2. 前提真实性

一个论证可以形式上完全有效，却因前提虚假而一文不值；也可以前提全部为真，却因推理有漏洞而无法得出结论。只有两个维度同时满足，论证才真正具有认知价值：

健全论证（sound argument）= 有效 + 前提均真
有认知价值的论证（cogent argument）= 归纳强 + 前提均真

ARG 评估框架

对于非演绎论证（日常论证、说服性论证、政策论证），教授提出了一个三条件框架，一个合理论证（cogent argument）必须满足全部三条：

A — 可接受性（Acceptability）：前提本身是否可以接受？
R — 相关性（Relevance）：前提是否与结论相关？
G — 充分性（Grounds / Sufficient）：前提是否提供了充分的支持？

这三个条件缺一不可。一个前提可以是真实的（满足A），也与结论相关（满足R），但仍然不足以支持结论（不满足G）——例如"这个人是个好父亲，所以他会是个好总统”。ARG框架的实践意义在于：当你拒绝一个论证时，仅仅说"我不接受这个结论"是不够的。你必须指出哪一个条件没有满足，以及为什么。批判性思维要求的是理由，不是态度。

常见错误

假有效性：一个论证形式上看起来像有效推理，但实际上前提与结论之间没有必然的逻辑关联。例如"所有中国人都爱吃饺子；小明是中国人；所以小明是男的”——这个论证显然无效，因为结论完全游离于前提之外，与前提建立的任何推理链条都没有关系。在真实论证中，假有效性往往更隐蔽：它常常依赖于情感共鸣或隐含假设，让推理看起来通顺，却经不起仔细检验。

关键区分：有效性是论证的属性，不是主张的属性。我们说"这个论证有效”，而不说"这个主张有效”。说一个主张"有效"是一种混淆——一个孤立的主张本身没有有效或无效之分，只有真假之分。有效性永远是前提与结论之间关系的描述。

第五讲：常见论证形式

整个西方逻辑传统，可以粗略地说是对"哪些推理模式是可靠的"这一问题的系统探索。亚里士多德在公元前4世纪写下《工具论》（Organon），第一次系统地整理了有效三段论的形式——他列出了14种有效的三段论式，并逐一论证其有效性。这是人类历史上第一部真正意义上的形式逻辑著作，它的意义在于：与其每次遇到一个论证都从头分析，不如识别出其论证形式，然后套用已知有效的模板。一旦论证符合某个已验证的有效形式，其推理结构就无需再次检验。

然而，这种"形式识别"策略也有其陷阱：外形相似的论证，其有效性可能相差悬殊。假言推理（Modus Ponens）与肯定后件（Affirming the Consequent）看起来几乎一样，但前者有效，后者无效。日常语言会将这种区别掩盖起来，正式逻辑符号则将其一目了然地呈现。

演绎有效论证形式

形式	结构
假言推理（Modus Ponens, MP）	P1: 若 A 则 B；P2: A；∴ B
拒取式（Modus Tollens, MT）	P1: 若 A 则 B；P2: ¬B；∴ ¬A
选言三段论（Disjunctive Syllogism, DS）	P1: A 或 B；P2: ¬A；∴ B
假言三段论（Hypothetical Syllogism, HS）	P1: 若 A 则 B；P2: 若 B 则 C；∴ 若 A 则 C
反证法（Reductio ad Absurdum, RAA）	假设 ¬C 导出矛盾，∴ C
排除论证（Argument by Elimination）	列举所有可能，逐一排除，余者即真
构造性困境（Constructive Dilemma）	P1: A 或 B；P2: 若 A 则 C；P3: 若 B 则 D；∴ C 或 D

常见无效论证形式（谬误形式）

⚠️ 肯定后件（Affirming the Consequent）：若 A 则 B；B；∴ A — 无效！
⚠️ 否定前件（Denying the Antecedent）：若 A 则 B；¬A；∴ ¬B — 无效！

这两种谬误形式极为常见，因为它们与有效形式在结构上高度相似，容易引发混淆。“肯定后件"在科学推理中尤其危险——当一个理论预测了现象B，而我们果然观察到了B，并不意味着理论正确：可能有多个不同的理论都能预测B。这正是科学哲学家卡尔·波普尔（Karl Popper）强调"可证伪性"的原因：科学理论的强度，不在于它能预测的事实，而在于它能被哪些可能的观察所否定。如果一个理论对所有可能的结果都"兼容”，它其实什么都没有说。

“否定前件"在政治与道德论证中频繁出现：“如果你爱国，就应该支持这项政策；你不支持这项政策；所以你不爱国。“这个论证犯了否定前件谬误——不支持某政策并不意味着不爱国，也许还有其他爱国的方式。但由于前提与结论之间有情感上的自然关联，这种谬误往往不会被立即识破。

第六讲：非形式谬误（一）

在第五讲中，我们看到的是形式谬误——推理结构本身错了，即便前提全部为真，结论也无法成立。但现实中的坏论证很少如此暴露：它们大多在形式上是合理的，错误藏在前提的内容里，或者藏在语言的修辞包装之中。这类错误被称为非形式谬误。

非形式谬误（informal fallacies）是推理在内容层面而非形式层面上出现的错误。即使论证形式正确，若前提有问题，同样构成谬误。这些谬误的研究历史和形式逻辑一样悠久：亚里士多德在《辩谬篇》（De Sophisticis Elenchis）中已经列举了多种辩论中常见的谬误手法，称之为"诡辩家的反驳”（sophistical refutations）。这部著作的意义在于：它第一次系统地说明，谬误不只是"说错了”，而是有可识别的、反复出现的结构模式——正是因为这些模式有规律，我们才能学会识别它们。

学习非形式谬误，最重要的能力不是背诵名单，而是发展出一种对推理的持续怀疑习惯：不因论证来自权威而接受，不因论证触动情感而接受，不因论证符合自己的预设而接受。每当你发现自己在被一个论证"说服"时，最好的习惯是停下来问：它真正在做什么？前提与结论之间的连接是逻辑的，还是只是修辞的？

转移注意力（Red Herring）

转移注意力（Red Herring）是指通过引入一个不相干的话题来转移讨论焦点，使对话偏离原来的论证轨道，从而避免正面回应原始问题。这个术语来自猎狐传统：训练猎犬时，人们会在狐狸踪迹旁边拖曳一条熏咸鱼（smoked herring，颜色发红），让气味强烈的腥味干扰猎犬的嗅觉判断——狗被引开了，真正的猎物却逃脱了。日常论证中的"红鲱鱼"功能完全相同：论证者无法直接回应某个强有力的质疑，便抛出一个情感上更吸引人的话题，让听者的注意力随之流走。

识别红鲱鱼的关键是：被引入的新话题是否真的与原始论证相关？ 如果不相关，它只是一条熏咸鱼。

稻草人谬误（Straw Man）

歪曲对方立场，攻击一个更容易驳倒的版本，而非真实立场。

教授在课堂上用的经典案例是堕胎争论。支持堕胎权的人通常的立场是：在特定条件下，女性对自己身体有选择权。但反对方常常将这个立场歪曲为"支持随意终止生命”，然后攻击这个伪版本——“怎么可能随意终止一个生命呢？“这个攻击成功了，但打倒的不是对手的真实主张，而是一个被故意设计得容易打倒的稻草人。识别稻草人谬误的核心问题是：对方真的说过被攻击的那句话吗？

中文语境： 当有人提出"应提高国产药疗效标准、使其更接近原研药”，就被人说"你看不起国产，你崇洋媚外”；当有人呼吁"理性讨论家暴、厘清事实真相”，就被人说"你在为施暴者洗地”。对方并未说过被攻击的那句话，但这个伪造版本更容易被情绪化地击倒。在网络舆论中，稻草人谬误往往与诉诸大众叠加：先歪曲对方观点，再动员他人围攻，形成精致的逻辑陷阱。

假二分法（False Dichotomy）

错误地将一个问题简化为只有两种选择，忽略了其他可能性。

例： “要么支持我们，要么反对我们。"（可能还有中立等立场）

人身攻击（Ad Hominem）

通过攻击论证者本身来否定其论证，而非分析论证的内容。有三种子类型：

类型	说明
辱骂式（Abusive）	直接侮辱对方人格
情境式（Circumstantial）	指对方有利益关系，因此其主张不可信
以彼之矛（Tu Quoque）	“你自己也不是这样做的”，指责对方言行不一

注：情境式 ad hominem 在某些情况下可以是相关证据（提示我们要审慎），但不能直接推翻论证。

滑坡谬误（Slippery Slope）

声称某个行动会导致一系列不可避免的负面后果，但没有充分支持"这个滑坡确实会发生"的证据。

中文语境： 2007年南京彭宇案引发大量滑坡式舆论：“如果这个判决成立，那以后谁还敢扶老人→如果好心人都被诬告→社会道德就彻底完蛋了。“推理链条中的每一步跳跃都缺乏独立的因果证据；一起有瑕疵的判决，并不必然导致整个社会的道德崩塌。真正的危险不在于某个社会"会崩溃”，而在于我们不再允许社会存在合理的中间状态。

第七讲：非形式谬误（二）

前一讲的谬误大多具有明显的"攻击性”——它们通过情感操控或人身转移来压制对手。这一讲要处理的谬误则更为狡猾：它们往往伪装成正常推理，需要更仔细的结构分析才能识破。循环论证可以用非常权威的语气说出来；草率概括可以用大量数据包装；诉诸权威可以来自真正的专家。正因如此，这一讲的谬误在学术、法律和政策讨论中出现的频率，并不低于那些赤裸裸的情绪操控。

循环论证 / 乞题（Begging the Question / Circular Reasoning）

论证中将结论（或其等价表述）暗藏于前提之中，用待证之事来证明自身。

例： “圣经是真的，因为上帝说的话都是真的，而圣经记载了上帝的话。”

歧义谬误（Equivocation）

论证中某个关键词在不同地方使用了不同的含义，却被当作含义相同来处理。

例： “法律对自然人有约束力；物理规律是法律；所以物理规律对人有约束力。"（“法律"一词含义转换）

草率概括（Hasty Generalization）

从数量太少或不具代表性的样本出发，得出关于整体的结论。

偏颇概括（Biased Generalization）

样本数量不小，但选取方式存在系统性偏差，因此结论依然不可靠。

事后谬误（Post Hoc Ergo Propter Hoc）

“在此之后，所以因为此”——仅仅因为 B 在 A 之后发生，就认为 A 导致了 B。

例： “我戴上幸运符之后，队伍就赢了，所以幸运符让我们赢了。”

中文语境： 微信群中流传的养生谣言大量依赖此结构——“我每天早上喝一杯盐水，今年一次感冒都没有，所以盐水能防感冒。“事件 A（喝盐水）先于事件 B（未感冒），但两者之间不存在已确立的因果机制；该人可能同时改善了睡眠、减少了外出，或只是这年流感季节性较轻。“努力就能成功"也有类似问题：成功者确实往往努力，但反向推断"只要努力就会成功”，忽略了资源、结构性机会等变量，是因果关系的简化误读。

赌徒谬误（Gambler’s Fallacy）

认为过去的随机事件会影响未来独立事件的概率。

例： “已经连续五次正面了，下次一定是反面。"（独立事件的概率不受历史影响）

诉诸权威（Appeal to Authority）

分为两类：

合理诉诸权威：被引用的权威在相关领域确有专业资质，且专家共识支持该主张
谬误性诉诸权威：权威不是该领域专家，或专家之间存在明显分歧，却当作确定性证据

中文语境： 社交媒体上的测评博主声称某平替产品"吊打旗舰、性价比之王”，当该品牌广告覆盖大量头部博主时，受众的判断便从产品实际质量转移为"这么多博主推荐，应该不会差”。权威绝不能与正确画等号；博主、网红、甚至院士的意见，都只是参考依据，而非替代独立判断的理由。

以立场株连（Guilt by Association）

以立场株连（Guilt by Association）是指通过将某个立场与某个令人反感的群体或人物相联系，来否定这个立场。注意它与人身攻击的细微但重要的区别：人身攻击攻击的是提出论证的人——“别信他，他是个共产党员”；以立场株连攻击的是论证所持的立场——“别支持废除死刑，那是共产党人的主张”。两者都是谬误，但后者更为隐蔽，因为它表面上是在谈论观点而非人身。

教授给出的例子：有人说"我们不应该废除死刑，因为那正是共产党人支持的做法。“这个论证通过将"废除死刑"这一立场与令人不快的群体相连，试图在不讨论实质理由的情况下否定这个立场。正确的回应是：一个立场是否正确，与谁持有这个立场无关。

诉诸力量与诉诸怜悯

相关性谬误家族中还有两个拉丁名称值得记忆：

论棍（argumentum ad baculum，诉诸力量）：用威胁或强制来替代理性说服。极端版本是"相信我，否则我打你”——用暴力代替论证。更常见的版本是政治与商业谈判中隐含的权力施压：因为论证本身站不住脚，便诉诸后果威胁来迫使接受。

论恻（argumentum ad misericordiam，诉诸怜悯）：用情感上的悲悯来替代理性论证。“你应该给我这份工作，因为我的家庭很困难”——这可能是一个真实的事实，也确实令人同情，但它与这个人是否有能力胜任工作完全无关。怜悯可以是道德考量，但不能替代论证的逻辑核心。

这三种谬误的共同点是：用与结论无关的因素（情感关联、权力关系、同情心）来替代真正的逻辑支持。

第八讲：语言——模糊性与歧义性

哲学中有一个深刻的元问题：我们用来思考的工具——语言——本身就是不精确的。当我们试图用自然语言来表达精确的逻辑论证时，语言自身的模糊性和歧义性便成了绊脚石。20世纪初，逻辑学家弗雷格和罗素正是为了逃离自然语言的这些缺陷，才发明了形式化的逻辑符号系统——他们希望创造一种"上帝的语言”，在其中每个符号只有一个明确的意义，每个句子只有一个明确的真值条件。

但我们大多数时候不使用逻辑符号；我们使用汉语、英语、粤语。这意味着我们必须正面面对自然语言的模糊性，而不是逃离它。理解语言的模糊性，有助于我们：一、在分析他人论证时，识别那些依赖模糊词语偷运结论的推理；二、在制定法律、政策或合同时，意识到哪些词语需要进一步精确化，否则会引发争议。

语言是思维的载体，但语言本身的特性会给论证带来问题。

模糊性（Vagueness）

一个词是模糊的，当它存在边界情形（borderline cases）——即我们无法确定该词是否适用的情形。

例： “高”、“老”、“秃”、“堆”

连锁谬论 / 渐进悖论（Sorites Paradox）：
P1: 1粒沙不构成一堆；
P2: 若 n 粒沙不构成一堆，则 n+1 粒也不构成；
∴ 任何数量的沙都不构成一堆。

这个悖论揭示了模糊词的根本性问题——没有截然的分界线（开放纹理，open texture）。

模糊性不等于主观性：我们对"高"可能有主观感受，但"高"作为词语本身具有语言共同体赋予的客观模糊边界。这个区别很重要：说"高是主观的，所以任何关于高的争论都不可解决”，是一种过度反应。更准确的态度是：承认某些边界情形是模糊的，同时认识到大多数情形是清晰的——“姚明比一般成年人高"这一断言并不因"高"有模糊边界而失去意义。

在中文语境中，模糊性还有一个有趣的维度：汉语中大量表达具有极高的语境依赖性。“差不多"一词在不同场合可以意味着"几乎完全相同”，也可以意味着"勉强过得去”。法律文件中"合理”、“适当”、“及时"等模糊词语，往往是诉讼争议的核心——精确化定义这些词语，是法律解释学的核心任务之一。

歧义谬误（Equivocation）

歧义谬误（Equivocation）是指在一个论证中，关键词在不同位置使用了不同的含义，而论证却把两种含义当作同一个意思处理。教授给出了一个令人印象深刻的经典例子：

P1：在我和你之间什么都没有（there is nothing between us）。 P2：两者之间什么都没有的，必然相连。 ∴ 我和你是相连的。

“between"在P1中是关系意义（情感上没有隔阂），在P2中是物理空间意义（中间不存在隔离物）。这个论证的形式看起来是有效的，但只要我们注意到词义的转换，它就立刻崩溃了。歧义谬误在哲学和政治辩论中极为常见，因为自然语言中大量词汇拥有多个紧密相关却并不相同的含义。

歧义性（Ambiguity）

一个表达有多个明确含义，且在特定语境中不清楚使用的是哪个含义。

类型	说明	例子
语义歧义（Semantic）	某个词有多个不同词典含义	“bank”（银行/河岸）
句法歧义（Syntactic / Amphiboly）	句子的语法结构可以有多种解读	“我看到一个带望远镜的男人”

婉辞与说服性定义

语言不只用于描述现实，还可以用于塑造对现实的感知。两种常见的语言操控机制：

婉辞（euphemism）用中性或正面的词汇替换具有负面含义的词汇，以改变情感反应而非事实内容。一家即将裁员的公司不说"我们正在破产”（we’re going bankrupt），而说"我们有资金流问题”（we have a cash-flow problem）——事实完全相同，但后者召唤的情感反应是暂时困难而非根本危机，从而影响债权人和员工的判断与行为。军事语言尤善此道：“附带损害"替代"平民伤亡”，“强化侦讯"替代"酷刑”。

说服性定义（persuasive definition）则更为彻底：用带有强烈情感色彩的表达给一个中性概念下定义，将语言的情感力量悄悄捆绑在一个看似客观的定义上。例如"真正的男人不哭”（Real men don’t cry）——这不是一个关于男性行为的描述性统计，而是一个附带了价值判断的规定性定义，它通过重新划定"真正的男人"这个范畴的边界，来制造情感压力。辨别说服性定义的方法是问：这个定义是在描述事实，还是在强加评价？

第九讲：定义

苏格拉底一生中大量时间花在追问"X 是什么"：什么是勇气？什么是正义？什么是知识？他发现，几乎所有人都以为自己知道答案，却在追问之下无法给出能够经受检验的精确定义。柏拉图将这种追问记录在一系列对话录中，其中《美诺篇》（Meno）专门探讨"什么是美德"，《泰阿泰德篇》（Theaetetus）探讨"什么是知识"——后者提出了至今仍被哲学家讨论的"真justified true belief"定义，以及Gettier在1963年的反例。这段两千五百年的对话，正是由于"定义"的问题从未被彻底解决。

在中国哲学传统中，孔子将"正名"（zhèngmíng，correct naming）视为治国的第一要务。《论语》中有一段著名对话：子路问孔子"若卫君待子而为政，子将奚先？“孔子回答"必也正名乎！"——若名实不符，则言语不通，事无可成。孔子所关切的，是概念与现实之间的对应关系：如果"父亲"被称为父亲，“臣"被称为臣，但实际行为与这些名称所规定的角色不符，社会秩序便会瓦解。这与我们在本讲所讨论的"精确定义"的目标，有着异曲同工之妙：定义不只是语言问题，而是关于我们如何在概念与现实之间建立可靠对应的根本问题。

定义的类型

类型	目的	例子
词典定义（Lexical）	报告词的现有用法	词典中"椅子"的定义
规定定义（Stipulative）	为新词或专业用法规定含义	定义"夸克”、“像素”
精确定义（Precising）	在已有词义基础上消除模糊性	法律中"成年人"的精确年龄
阐释定义（Explicative）	系统地澄清某个重要概念	哲学中对"知识"的分析

属加种差定义法（Definition by Genus and Differentia）

这是最常用的精确定义方式：先指明被定义对象所属的类（genus），再说明使其区别于同类其他成员的特征（differentia）。

例： “人是有理性的动物”——动物（属）+ 有理性（种差）

“X 是什么？“问题

哲学中的定义性问题往往不满足于列举例子，而是要求找出使某事物成其所是的必要且充分条件。

必要条件（necessary condition）：若某事物是 X，则它必然满足条件 C
充分条件（sufficient condition）：若满足条件 C，则该事物必然是 X

好的定义要求：既无过宽（包含了非 X 的事物），也无过窄（排除了真正的 X）。找到同时满足"必要且充分"的定义条件，往往比想象的困难。以"知识"为例——我们直觉上认为，要知道某事 P，需要：(1) P 是真的；(2) 你相信 P；(3) 你有充分理由相信 P。这三个条件看起来似乎是充分必要的——但哲学家盖蒂尔（Edmund Gettier）在1963年一篇仅三页的论文中，用一个巧妙的反例推翻了这个看似完美的定义：一个人可以同时满足这三个条件，但我们仍然不愿意说他"知道"那件事。这篇短文至今仍是哲学史上被引用最多的文章之一，催生了整个"知识论的Gettier问题"研究领域——这正是因为，寻找精确的必要且充分定义比我们预期的难得多。

第十讲：命题逻辑（SL）——基本连接词

形式逻辑的发展，代表了人类试图将理性本身精确化的最雄心勃勃的尝试。亚里士多德的三段论体系主导了西方逻辑两千年，直到19世纪末，英国数学家乔治·布尔（George Boole）和德国哲学家弗雷格（Gottlob Frege）才彻底革新了这一领域。布尔在1854年的《思维规律》（The Laws of Thought）中，将逻辑运算用代数方法处理，奠定了现代命题逻辑的基础。弗雷格走得更远：他在1879年出版的《概念文字》（Begriffsschrift）中，创造了一套能够表达量化关系的完整形式语言——这也是我们在下一讲谓词逻辑中将要遇到的核心工具。弗雷格的目标是清晰崇高的：将数学中所有真理都从纯逻辑原则中推导出来。这个计划最终遭到罗素悖论的打击，但它所留下的形式工具，成为了整个现代逻辑学与计算机科学的共同基础。

命题逻辑（Sentential Logic, SL）是一种形式化语言，用来精确表达和分析论证结构。它的核心思想是：将自然语言中的复杂句子，分解为原子命题与逻辑连接词的组合，然后用符号的方式明确地表达它们之间的真值关系。通过这种形式化，那些在自然语言中模糊可疑的推理，往往会立刻暴露出其问题所在。

基本连接词

符号	名称	含义	真值条件
`¬A`	否定（Negation）	非 A	A 为假时为真
`A & B`	合取（Conjunction）	A 且 B	两者均真时为真
`A v B`	析取（Disjunction）	A 或 B（相容或）	至少一个为真时为真
`A ⇒ B`	条件句（Conditional）	若 A 则 B	仅当 A 真 B 假时为假

一个容易忽略的翻译规则：英语中的”but“与”and“在逻辑上完全等价，两者都翻译为合取（&）。“但"表达的是说话者的惊讶或对比感受，这属于语用（pragmatic）信息，而非逻辑内容。就像一枚炮弹的颜色不影响其弹道计算，“但"所携带的"意外"色彩不影响它的真值条件——“他聪明但懒惰"与"他聪明且懒惰"在逻辑上是完全相同的主张。类似地，“unless”（除非）通常翻译为析取（v）。

前件与后件

在 A ⇒ B 中：

前件（antecedent）：A（“若"后面的部分）
后件（consequent）：B（“则"后面的部分）

充分条件与必要条件

A 是 B 的充分条件：A ⇒ B（A 成立足以保证 B 成立）
A 是 B 的必要条件：B ⇒ A（没有 A 就没有 B）

"only if"（仅当）：
"A only if B" = "若 A 则 B" = A ⇒ B
（"B" 出现在 "only if" 之后，是后件）

记忆技巧："only if"后面跟的是必要条件，即后件（consequent）。"睡觉是做梦的必要条件"→"你在做梦，only if 你在睡觉"→ 做梦 ⇒ 睡觉。相比之下，充分条件放在前件：点燃火柴是引发爆炸的充分条件（在充满汽油蒸气的地方）→ 点燃火柴 ⇒ 爆炸。

充分条件与必要条件的区分，是日常推理中最容易混淆的逻辑关系之一，也是第五讲中"肯定后件"谬误的根本原因。“是人就会死"意味着"是人"是"会死"的充分条件；但反过来，“会死"不能推出"是人”——会死是动物的共同命运，不是人类的专属。将充分条件与必要条件混淆，等同于将 A⇒B 与 B⇒A 当作等价——而这两者在逻辑上可以完全不相干。许多日常错误推理——从广告中的"只有用X，才能实现Y（其实只是充分条件之一）“到政策论辩中的"没有增长就没有就业（其实只是最常见情形）"——都可以用这个框架来识别。

德摩根定律

¬(A & B) ≡ ¬A v ¬B
¬(A v B) ≡ ¬A & ¬B

“neither A nor B” = ¬A & ¬B = ¬(A v B)

德摩根定律在实践中尤为有用：它能帮助我们正确处理否定句。“没有人既高且壮”（neither tall nor muscular），直觉上可能被理解为好几种不同的表达，但用符号写出来就清晰了。法律文本、合同条款、算法条件——所有依赖精确否定逻辑的语境，都会用到这些定律的直觉或显式形式。

第十一讲：命题逻辑证明

形式证明系统代表了一种将"论证"彻底机械化的尝试。如果我们拥有一套完整的推理规则，并且这套规则是可靠的（sound）和完备的（complete），那么原则上每一个有效的论证都可以通过一系列机械步骤加以验证——无需任何直觉或洞见，只需跟随规则。这正是莱布尼茨梦想中"理性计算机”（calculus ratiocinator）的核心愿景，也是后来图灵机和现代计算机的思想先驱。

当然，形式证明在日常批判性思维中并不是最常用的工具——我们不会在咖啡馆争论时画证明树。但学习形式证明有一个重要的副产品：它迫使你将论证的每一步都显式化，不允许任何隐含的跳跃。当你无法在形式证明中完成某一步时，通常是因为那一步在逻辑上是无法成立的——证明系统充当了一个不偏不倚的裁判。

SL 的形式证明系统允许我们从前提出发，通过应用推理规则（inference rules），一步步推导出结论。每一步都必须援引一个具体的推理规则，不允许任何"感觉上是对的"的跳跃。这种纪律性，正是形式证明的价值所在。

理解子证明（subproofs）的一个好比喻：假设就像贷款（assumptions are like taking out a loan）。每次引入一个新假设，你就欠下了一笔逻辑债务——你的证明处于更深的缩进层级，处于一种"假设成立"的条件世界中。条件证明（CP）是还清这笔债的方式：你在子证明中从假设A推出了B，就可以退出子证明，得到A⇒B这个无条件的结论，债务偿清。反证法（RAA）同理：你假设了¬A，推出了矛盾，就可以退出，得到A。子证明的缩进结构在视觉上直观地反映了这种"债务”：缩进越深，你所处的假设条件越多，尚未偿还的逻辑债也越多。

基本推理规则

规则	缩写	说明
合取消去	&E	从 `A & B` 得 `A` 或 `B`
合取引入	&I	从 `A` 和 `B` 得 `A & B`
假言推理	MP	从 `A ⇒ B` 和 `A` 得 `B`
条件证明	CP	假设 A，若能推出 B，则得 `A ⇒ B`
反证法	RAA	假设 ¬A，若推出矛盾，则得 `A`
构造性困境	CD	从 `A v B`、`A ⇒ C`、`B ⇒ D` 得 `C v D`
析取引入	vI	从 `A` 得 `A v B`
双重否定消去	¬¬E	从 `¬¬A` 得 `A`
重复	R	从 `A` 得 `A`（用于子证明中）

证明无效性

若要证明一个论证无效，只需找到一种赋值（assignment of truth values），使得所有前提为真而结论为假。这称为反例（counterexample）。

方法（Dead Reckoning）：将结论赋值为假，将所有前提赋值为真，检验是否存在一致的赋值方案。若存在，则论证无效。

反例方法体现了一个深刻的逻辑原则：有效性是一个全称主张（“对所有可能的赋值……"），而证明全称主张的反面，只需一个反例。这与科学中的可证伪性原理异曲同工：一个科学理论主张"所有X都是Y”，而一个反例就足以证伪它。在数学中，这被称为"反例证明”（proof by counterexample）——这种方法之所以有力，正是因为全称量化的逻辑特性：你无法找遍所有可能来验证有效性，但你只需一个反例来推翻它。

构造性困境的经典运用

教授用构造性困境展示了一个哲学家特有的日常论证结构：

P1：你要么继续读哲学，要么退学。 P2：如果你继续读哲学，你不会变富。 P3：如果你退学，你也不会变富。 ∴ 不管怎样，你都不会变富。

这是一个形式有效的构造性困境论证（A v B; A⇒C; B⇒C; ∴ C）。教授说这是哲学系学生的实际处境。注意这里C出现在两个后件中，结论可以进一步简化。面对这类"困境”，唯一的逻辑出路是否定P1（找到第三条路），或否定P2/P3中的一个——在逻辑上逃出困境，需要找到哪个前提是可以攻击的。

第十二讲：谓词逻辑（PL）

命题逻辑是一个强大但有限的工具。它能分析"若A则B；A；所以B"这类由命题整体构成的推理，但对于涉及个体、性质和量化关系的论证，它却束手无策。考虑经典的三段论：“所有人都会死；苏格拉底是人；所以苏格拉底会死。“在命题逻辑中，我们只能将这三句话分别设为命题变量P、Q、R，但这样就完全丢失了内部结构——“所有人"与"苏格拉底是人"之间的"人"指向同一个概念，这种关系是三段论之所以有效的核心，命题逻辑无法捕捉。

这正是弗雷格的革命性贡献：谓词逻辑（Predicate Logic, PL）引入了个体变量、谓词和量词，使我们能够分析命题的内部结构，揭示命题逻辑所不可见的推理关系。这一工具不仅彻底重塑了逻辑学，也成为整个现代数学基础（集合论、数论）的形式语言，并直接影响了计算机科学中程序验证和数据库查询的理论基础。

命题逻辑无法分析涉及"所有”、“存在"等量化关系的论证。谓词逻辑引入了个体变量和量词来处理这类情况。一个简单的例子说明了SL的局限性：“Bob有金发，所以某人有金发”——这个论证显然有效，任何人都会同意，但在命题逻辑中，我们只能把整个"Bob有金发"设为P，把"某人有金发"设为Q，两者之间没有任何形式连接；SL对这个论证什么也说不了。只有谓词逻辑才能捕捉这里的关键步骤：从一个特定个体的性质，推断至少有一个个体具有该性质（存在引入规则）。

基本元素

元素	说明	例子
单称词项（singular terms）	指称特定个体的名称	`a`（苏格拉底）、`b`（亚里士多德）
谓词（predicates）	表达性质或关系的表达式	`Hx`（x 是人）、`Lxy`（x 爱 y）
变量（variables）	代表任意个体	`x, y, z`
全称量词（universal quantifier）	∀x（“对所有 x”）	`∀x(Hx ⇒ Mx)`
存在量词（existential quantifier）	∃x（“存在 x”）	`∃x(Hx & Mx)`

论域（Universe of Discourse, UD）：量词所量化的范围。必须明确指定，否则句子含义不确定。

四种基本命题形式（传统逻辑）

名称	代号	例子	PL 表达式
全称肯定	A	所有 X 都是 Y	`∀x(Xx ⇒ Yx)`
全称否定	E	没有 X 是 Y	`∀x(Xx ⇒ ¬Yx)`
特称肯定	I	有些 X 是 Y	`∃x(Xx & Yx)`
特称否定	O	有些 X 不是 Y	`∃x(Xx & ¬Yx)`

注意：A 形式用条件句（⇒），I 形式用合取（&）。混淆这两点是最常见的错误。
❌ ∀x(Xx & Yx)——错误！这意味着"所有事物既是 X 又是 Y"
❌ ∃x(Xx ⇒ Yx)——错误！这几乎总是为真（若 x 不是 X，条件句自动为真）

对立方阵（Square of Opposition）

A（全称肯定）————矛盾————O（特称否定）
      |                          |
    对立                       下对立
      |                          |
E（全称否定）————矛盾————I（特称肯定）

A 与 O 互为矛盾（不能同真，不能同假）；E 与 I 互为矛盾。

这个方阵有一段有趣的历史：亚里士多德原始体系中认为，A与I之间存在"下蕴含"关系（A真则I真），但这个关系在现代逻辑中并不总是成立——如果论域为空（没有任何X），则"所有X是Y”（A形式）在现代逻辑中被视为真（空真值），而"有些X是Y”（I形式）则为假。教授给出了一个生动的例子：如果你宣称"世界上根本没有独角兽！"，那么在空论域下，“所有独角兽都是粉红色的"和"没有独角兽是粉红色的"这两个命题在现代逻辑中同时为真——因为两者都是在一个空集合上的全称量化，都是空真（vacuously true）的。这在直觉上令人不安，但它揭示了现代逻辑对全称量词的形式定义与日常语言直觉之间的一个根本差距。

苏格拉底必然一死：一个四步PL证明

作为谓词逻辑的入门示范，教授展示了如何将"苏格拉底必然一死"这个人类最古老的三段论用PL严格表达并推导：

1. (∀x)(Hx ⇒ Mx)      前提：所有人都会死
2. Hs                   前提：苏格拉底是人
3. Hs ⇒ Ms             1，全称实例化（UI）
4. Ms                   2，3，MP：苏格拉底会死

这四步就是整个证明。第3步的全称实例化（Universal Instantiation）是谓词逻辑特有的推理规则：从关于所有x的陈述，推导出关于某个特定个体的陈述。这看起来显而易见，但在SL中却无法表达。

模糊性打破经典逻辑：毛发悖论

谓词逻辑是研究确定性谓词的工具，但当我们将它应用于模糊谓词（第八讲）时，会出现令人不安的结果。考虑"毛发茂盛”（bushy-headed）这个谓词：

P1：有10,000根头发的人是毛发茂盛的。 P2：若某人有n根头发且是毛发茂盛的，则有n-1根头发的人也是毛发茂盛的（一根头发的差别不影响是否茂盛）。 ∴ 有17根头发的人是毛发茂盛的。

这个论证通过对P2反复应用，可以一步一步地得出这个结论——作为一个有效论证的结论！教授评论说：“Something has gone seriously wrong.” 问题出在哪里？P2"几乎是真的”，但不是真正真的。“几乎为真"不等于真——这正是模糊谓词无法完全融入经典二值逻辑（真/假，没有中间状态）的原因。滑坡同化谬误（Slippery Assimilation Fallacy）正是这个逻辑错误的名称：将模糊概念的边界情形当作精确概念处理，然后利用这种错误精确性推导出荒谬的结论。

第十三讲：相关性

“数字不会撒谎"是现代社会中流传最广的迷思之一。事实上，数字可以通过选择性呈现、不恰当的比较、或有偏差的抽样，传达出与真实情况完全相反的印象。统计学家达莱尔·哈夫（Darrell Huff）在1954年写下《如何用统计撒谎》（How to Lie with Statistics），至今仍是揭示这类把戏的经典——这本书描述的每一种统计操纵手法，在今天的新闻报道和社交媒体上依然原汁原味地存在着。

统计推理的核心问题是：从样本推断总体。我们几乎从不能观察到我们真正想了解的整体（全国所有选民、所有接受某治疗的患者、所有使用某产品的消费者），只能观察其中的一部分。这个从部分到整体的推断，是否有效，完全取决于样本与总体之间的关系是否可靠。批判性评估统计论证，首要任务就是质疑这个连接：样本是随机的吗？样本足够大吗？样本的来源是否引入了系统性偏差？

从个体观察推广到总体的论证是统计论证。理解其有效性需要掌握以下概念。

基本概念

总体（population）：研究的目标群体
样本（sample）：从总体中抽取的子集
随机样本（random sample）：总体中每个成员在每次抽样中被选中的概率相等

误差范围（Margin of Error）

样本大小与误差范围的经验关系：

样本量	误差范围（约）
25	±25%
100	±10%
500	±5%
2,000	±2%

超过约 2,000 后，继续增大样本量对降低误差的边际效益递减。

这些数字来自概率论的平方根法则：误差与样本量的平方根成反比。一个实践含义是，从100增加到400个样本，才能将误差减半（从±10%到±5%）。调查报告通常说"精确到±X%，19次中有19次”——这里的"19次中有19次"是95%置信区间的日常说法，意思是：如果用同样方法重复100次调查，大约95次的结果会落在真实值的±X%之内。

两种统计论证类型

类型一：简单统计主张（Simple Statistical Claim）

结论：总体中某性质的比例
前提：样本中该性质的比例 + 样本足够大且随机

类型二：相关性主张（Correlation Claim）

结论：两个变量之间存在正/负相关
前提：在足够大且随机的样本中观察到该相关性

偏颇样本的常见来源：自愿参与者、特定渠道招募、历史数据局限等，均可能导样本不具代表性。

相关性有时会出现令人惊讶的模式。教授提到的一个反直觉案例：在男性中，已婚与活过70岁正相关；但在女性中，同样的相关性却是负相关——已婚女性反而活得相对更短。理解这个结果需要考虑历史上婚姻对两性的不同社会功能：婚姻对男性带来的情感支持和生活照料，传统上对女性却可能意味着压力增加和自主减少。这个案例提醒我们：同一个变量（婚姻）可以在不同子群体中与同一个结果呈现方向相反的相关性——不区分子群体的总体相关性，有时会掩盖最重要的信息。

历史上最著名的偏颇样本案例发生在1936年美国总统大选。当时的电话调查预测共和党候选人将赢得大选，但实际结果是民主党取得了压倒性胜利。原因是：1936年能负担得起电话的人，系统性地倾向于富裕的共和党选民。这家调查机构此后关门大吉。这个教训提示了分层抽样（stratified sampling）的重要性：必须确保样本在重要人口特征（收入、地区、年龄等）上按总体比例构成，才能得到有代表性的结果。在中国语境中，网络调查尤其容易产生类似偏差：微博用户与全体公民在年龄、受教育程度、城乡分布上都存在显著差异，网络上的"主流意见"往往并不反映真实的社会民意分布。

1993年的《雅努斯报告》（The Janus Report on Sexual Behavior）是样本偏差的另一个教科书案例。该报告声称：70%以上的65岁以上老人每周至少发生一次性行为。这个数字令人震惊，但分析来源后发现：研究对象是从性治疗诊所招募的——这个群体显然不代表老年人总体。随后的随机抽样研究发现，同龄人中该比例仅为7%左右。类似的问题困扰着通过杂志读者问卷发表的大量性行为研究：《花花公子》、《红书》、甚至希特·报告（The Hite Report）的受访者都是自愿回复调查的读者，他们在性态度和行为上与一般公众存在系统性差异。自愿回复（voluntary response）样本几乎总是有偏的，这不是研究者主观造成的，而是由样本选取机制本身决定的。

第十四讲：因果关系

“相关不等于因果"是统计学中的金句，也是被最频繁援引、却仍被最频繁遗忘的原则之一。统计学家泰勒·维根（Tyler Vigen）在其著名的"虚假相关"数据库中展示了一系列令人忍俊不禁的高度相关关系：美国缅因州的离婚率与全美人均人造黄油消费量，历年来保持着高达99.2%的正相关——显然，减少黄油消费并不能挽救婚姻，这只是两个无关变量恰好随时间呈现相似趋势的巧合。但当同样的逻辑错误以更严肃的面目出现——“冰淇淋销量与溺水死亡人数正相关，所以吃冰淇淋导致溺水”（实际共因是夏季气温）——它就变得相当有迷惑性了。

因果推断是科学与医学中最核心、也最困难的方法论问题。英国统计学家布拉德福德·希尔（Bradford Hill）在1965年提出了评估因果关系的九项标准，至今仍是流行病学的权威参考框架。其中最重要的两条——关联的强度和关联的一致性——直接对应本讲将要讨论的反事实分析框架。因果主张天然是一种反事实主张：说"吸烟导致肺癌”，本质上是在说"若不吸烟（其他条件不变），肺癌概率会降低”。这个"其他条件不变”（ceteris paribus）正是所有因果研究的核心挑战。

相关不等于因果。即使 C 与 E 高度相关，也不能直接得出"C 导致 E”。教授最喜欢用的反例是：冰淇淋销量与公众裸晒行为（public nudity incidents）在数据上高度正相关——但这不意味着吃冰淇淋导致人们脱衣服。真实的共同原因（common cause）是夏季气温：气温升高既导致冰淇淋销量上升，也导致裸晒行为增加。这正是"相关不等于因果"最生动的课堂版本。

因果主张的特征

因果主张是关于反事实（counterfactual）的主张：若 C 没有发生（其他条件不变），则 E 也不会发生。

正因果因素（positive causal factor）：C 的出现使 E 更可能发生
负因果因素（negative causal factor）：C 的出现使 E 更不可能发生

注意：因果因素（causal factor）不等于充分原因或必要原因。吸烟是肺癌的正因果因素，意思是：吸烟者比不吸烟者（其他条件相同时）更容易患肺癌。这与"吸烟必然导致肺癌"或"只有吸烟才会得肺癌"都不相同。一个常见的反驳是：“我的海伦阿姨（Aunt Helen）抽烟一辈子，活到94岁，所以吸烟不会导致肺癌”——这个反驳误解了因果因素的定义。因果因素是关于概率的群体性声明，一个不患癌的长寿烟民并不能推翻它，就像一个不系安全带却没出事的司机，不能证明不系安全带是安全的。

三种实验设计

1. 随机实验设计（Randomized Experimental Design）
实验者随机分配受试者进入实验组（接受 C）和对照组（不接受 C）。
对人类受试者通常需要双盲设计（double-blind）：受试者和评估者都不知道谁在哪组。双盲的一个重要变体是假手术（sham surgery / mock surgery）：对照组的患者接受了"假手术"——所有切口和程序都真实进行，只是没有实施关键干预步骤。这对于排除安慰剂效应（placebo effect）至关重要，也引发了将人类置于手术风险之下却不给予真正治疗的伦理争议。正是这种对人体实验的道德约束，使得随机实验在医学中并非总是可行的选项。
证据强度：最强

2. 前瞻性设计（Prospective Design）
受试者自己选择进入 C 组或非 C 组，研究者追踪结果。由于C不是被强加的而是已存在的，不存在随机分配，需要通过统计方法控制变量（controlling for variables）。哈佛校友研究（Harvard Alumni Study）是一个经典案例：研究者追踪了哈佛毕业生的运动习惯与冠心病发病率的关系。初步数据显示两者相关，但批评者指出：运动更多的校友可能本身体重更轻。研究者随后控制了体重变量，发现即使在相同体重组别内，运动仍然是冠心病的独立负因果因素——这才是真正令人信服的结论。
证据强度：中等

3. 回顾性研究（Retrospective Study）
从已经发生了E（结果）的人出发，回顾性地构建一个匹配的对照组。由于研究者不是提前选定组别的，而是从结果反推原因，这是三种设计中证据最弱的。匹配变量的选择本身就影响结论：如果忘记控制某个重要的混淆变量，研究就会得出错误结论。
证据强度：最弱

评估因果假说的四步程序

识别相关性：C 与 E 之间是否真的存在相关性？
排除颠倒因果：是否可能是 E 导致了 C，而非相反？
排除共因：是否存在第三个因素 Z 同时导致了 C 和 E？
评估机制：是否有合理的因果机制解释 C 如何导致 E？

辛普森悖论：控制变量时的陷阱

控制变量有时会带来令人意外的结果反转。教授给出了"Bo Diddly大学"录取案例，这是辛普森悖论（Simpson’s Paradox）的课堂版本：

统计数据显示：文科学院男生录取率40%，女生录取率40%；理工学院男生录取率75%，女生录取率75%。在两个学院内，男女录取率完全相同，没有任何歧视。然而，汇总数据却显示：全校男生录取率约⅔，女生录取率约½。

为什么？因为女生有更高比例申请了竞争更激烈的文科学院（录取率较低），而男生有更高比例申请了更容易进入的理工学院（录取率较高）。当你不控制申请院系这个变量时，总体数据看起来像是存在严重的性别歧视；一旦控制了院系选择，歧视完全消失了。真正的"原因"不是性别，而是申请院系的不同分布——这才是那个被忽略的混淆变量（confounding variable）。

这个悖论揭示了为什么控制变量至关重要，也揭示了为什么不控制变量的总体相关数据可以说谎。在中文语境中：如果某城市私立学校学生的平均成绩高于公立学校，是否说明私立学校教学质量更好？需要控制学生入学时的家庭背景、认知基线等变量——否则看到的只是辛普森悖论的另一个版本。

这四步程序在中文社会话语中有着极为丰富的应用场景。“经济高速增长导致腐败增加”——还是"腐败减少监管阻力从而促进特定类型的增长”？这是颠倒因果的可能。“受教育程度高的人寿命更长”——还是"来自高收入家庭的人既更可能接受高等教育，又更有条件维持健康生活”？这是共因的可能。“中药X改善了患者的某项指标”——但如果没有已知的生物化学机制解释X如何作用，我们应当对这个声明保持更高的怀疑阈值。第四步"评估机制”，正是区分真正因果主张与统计巧合的最后关卡：我们理解这件事为什么发生，比仅仅知道它是否发生，要重要得多。

第十五讲：社会科学中的特殊问题

自然科学与社会科学之间存在一条深刻的方法论鸿沟，尽管两者都使用数据和统计方法。物理学家测量电子的自旋，电子不会因为被测量而改变自身行为；但社会学家调查人们对某政策的态度，被调查的人会因为知道自己在被调查而改变回答。这种反身性（reflexivity）是社会科学特有的方法论挑战：研究对象本身能够感知并回应研究过程。经济学中有一个著名的"古德哈特定律”（Goodhart’s Law）：当一个指标变成目标时，它就不再是一个好指标——一旦某项统计数据被用作政策评估标准，机构就会开始优化这个数字，而非优化它本应测量的现实。这一定律在中国地方政府的GDP考核体系中，在医院的门诊量考核中，在大学的论文发表数量排名中，都有其清晰的体现。

操作化（Operationalization）

许多社会科学中的重要概念（如"智力"、“幸福感”、“暴力”）本身是模糊的，无法直接测量。操作化是将这些抽象概念替换为可测量的指标的过程。

例：用"IQ测试分数"操作化"智力"；用"GDP"操作化"经济福利"。

操作化的风险：指标可能无法完整或准确地捕捉原始概念。教授给出了一个精彩的反例：柔道运动员（judo players）的IQ测试平均分往往低于一般大学生——如果我们将"IQ分数"等同于"智力"，就会得出柔道运动员不够聪明的结论。但柔道需要在极短时间内做出精确的运动判断，这需要高度的情境性认知能力（situational intelligence），而IQ测试测的是抽象推理，完全无法捕捉这一维度。问题不在于柔道运动员不聪明，而在于操作化定义选错了——用一个只测量部分维度的指标，然后用它代表整个概念，是一种说服性定义的失真。

“国内生产总值"作为"经济福利"的操作化指标，会记录某工厂造成的污染治理费用（因为这带来了经济活动），但不记录森林的生态价值（因为这没有市场价格）——GDP增长和真实福利改善之间的鸿沟，正是操作化失真的后果。诺贝尔经济学奖得主阿马蒂亚·森（Amartya Sen）正是基于对这种失真的批判，提出了以"可行能力”（capabilities）替代收入作为发展度量的理论框架，这直接影响了联合国人类发展指数（HDI）的设计。

研究中的价值偏见

研究结论可能受到非认知因素影响：

资助偏见（funding bias）：研究资助方的利益影响研究问题的设计和结果呈现
研究者偏见（researcher bias）：研究者自身的预期或价值观影响数据收集和解读
理论承诺（theoretical commitments）：对某理论框架的既有认同可能导致确认偏见

问卷调查的问题

歧义问题：题目措辞不清，不同受访者有不同理解
框架效应（framing effects）：同一内容的不同措辞方式会显著影响回答结果

例： “您支持安乐死吗？“vs.“您支持帮助终末期患者结束痛苦吗？”

一个尤为精彩的案例：某调查询问"对政客不能保持太严的监督，是吗？"（Can’t keep too close an eye on politicians!）。分析结果发现，大约25%的"是"来自"是，政客不可信，需要时刻盯着他们”；另外约10%的"是"来自"是，严密监控会让好人不愿从政，利益冲突要求会伤害好官员”——这两拨人的立场完全相反，却都回答了"是"。这35%的"是"是完全无意义的，它把持截然相反立场的人堆在了同一个答案下面。类似的问题在任何意见调查中都大量存在：调查设计者应当区分"支持监管"和"支持更严监管"，而非用一个含糊的双重否定句测量不可能准确测量的东西。

政治类调查还存在另一个问题：问题的顺序和参照点也会影响答案。调查显示，在问"您支持平衡预算吗？“时，大多数人表示支持；但在问"您支持削减以下具体项目吗？"（医疗、教育、基础设施）时，大多数人又表示反对——尽管两者在逻辑上是连通的。框架效应意味着，“多数人支持X"这个调查结论，会随着问题的具体措辞而剧烈变化。

蓄意操控

说服性定义（persuasive definition）：用带有强烈情感色彩的词汇给中性概念下定义，以引导态度
选择性事实呈现：只呈现支持某立场的事实，省略不利证据
“僵尸事实”（zombie facts）：已被科学界反驳但仍在流传的错误"事实”

选择性事实呈现可以相当隐蔽。教授举了一个政治声明的案例：某国总理宣称"我们在任期间，创造的就业岗位比英国、法国、德国三国加起来还要多”。仅从字面看，这似乎是令人印象深刻的政绩——但实际原因是德国统一后的裁员潮导致德国就业数字锐减，三国"合计"数字因此是负数，而与负数相比并不困难。真正令人印象深刻的绝对就业增长数字被刻意省略了，代之以一个经过精心挑选的比较基准，让成绩看起来比实际更好。这就是"樱桃采摘"（cherry-picking）的典型操作。

“爱斯基摩词汇大骗局”（The Great Eskimo Vocabulary Hoax）：长期流传"爱斯基摩人有50个（或更多）词来形容雪"这一说法，并被用来支持语言相对论（语言塑造思维）的论点。但语言学家仔细审查后发现，这一说法源于早期人类学家的夸大和对爱斯基摩语多合成词特性的误解——爱斯基摩语中一个概念可以通过词缀组合形成多种"词"，但这与英语不断创造复合词（snowflake, snowfall, snowpack）并无本质区别。这是一个**“僵尸事实"的完美案例**：一个未经仔细核查的说法，因为听起来符合人们对原住民知识的浪漫想象，便得以广泛流传，成为无数论文和科普文章的"证据”，直到专业语言学家系统追溯才将其揭穿。

苏珊·法鲁迪（Susan Faludi）在《反挫》（Backlash, 1991）中揭露了一个流传甚广的"统计数据"：30岁以上单身女性被闪电击中的概率高于结婚的概率。这个数字被媒体广泛引用，以营造未婚女性的恐慌感。法鲁迪追溯发现，这一数据完全是捏造的——没有任何学术来源，只是被反复转引，每次转引都增加了几分权威感。它成了"性别话语中的僵尸事实"的经典案例：一个被情绪化叙事需求驱动的伪统计，比真实数据流传得更广、更久。

中文语境： 诉诸恐惧（Appeal to Fear）是一种特殊的蓄意操控，在中文自媒体中尤为常见。典型话术结构为"如果你不做A，后果可能是B"：如"长期使用某品牌洗发水，你的孩子可能会得癌症（深度好闻）““90%的脑出血都和你忽略的这10个习惯有关（最后一个尤为关键）"。这类推送完全跳过了因果链条和证据检验，只依靠高强度的焦虑感迫使受众行动——是一种以忠告为名的理性劫持。

第十六讲：类比论证

类比是人类思维中最古老、也最强大的工具之一。在我们学会形式逻辑之前很久，就已经在用类比思考：这件新事物与我知道的什么相似？如果它和我熟悉的X相似，那它是否也具有X的某些性质？这种推理方式贯穿哲学、科学、法律和道德论辩的每一个角落。

在中国古典文学与哲学中，类比（比）是最重要的修辞与论证手段之一。《诗经》的"比”——以他物比此物——是中国文学批评的三大手法（赋比兴）之一。《庄子》几乎通篇是类比与寓言：鱼翁的鱼与人类的名利，朝菌不知晦朔与人类对永恒的执念……这些类比不是装饰性的，而是哲学论证的核心——通过建立恰当的类比，庄子试图让读者从一个新的角度看待人类处境的根本问题。孟子的政治论证也大量依赖类比：将君主对百姓的责任类比为父母对孩子的责任，将善政类比为耕种——这些类比能够有效传达复杂的政治哲学立场，因为听者对家庭关系和农业已经有直接经验。

但类比也是最容易被滥用的论证形式之一。一个好的类比能够照亮真相；一个坏的类比——错误类比——会遮蔽真相。区分两者，需要的正是本讲的核心概念：相关相似性。

类比论证（Arguments by Analogy）是通过比较两个事物的相似性，将已知事物的属性推广到未知事物。

论证结构

主体（primary subject）：我们希望得出结论的对象
类比物（analogue）：用于比较的、我们了解更多的事物
共同特征：主体与类比物共同具有的属性 X₁, X₂, …, Xₙ
待推特征：类比物具有、据此推测主体也具有的属性 Z

形式为：主体和类比物共享 X₁…Xₙ；类比物有 Z；∴ 主体可能也有 Z。

两种类型

归纳类比（Inductive Analogy）：基于事实相似性做出预测性推断。例： “这两种药在化学结构上相似；药物 A 有这种副作用；所以药物 B 可能也有。”

归纳类比在医学和毒理学中极为常见：动物实验中已知能导致人类癌症的所有物质，也都能在大鼠身上诱发癌症。这个规律支持了用大鼠实验预测人类毒性风险的做法。然而，一个常见的攻击是"大鼠毕竟不是人”——这个反驳本身不充分，因为它只指出了差异的存在，而没有指出哪个具体差异与癌症致病性相关。真正有效的反驳需要指出相关差异（relevant differences）而非任意差异。

一个更精彩也更具体的反驳是剂量问题：大鼠实验常常用相当于人类每天喝800瓶可乐的物质剂量来得出"某添加剂致癌"的结论。这个反驳是合理的——因为从极高剂量推断到正常人类摄入量需要引入一个比例性假设（the assumption of proportionality）：剂量翻倍，癌症概率翻倍。这个假设对某些物质成立，对另一些不成立。因此，对高剂量动物实验的正确批评不是"大鼠不是人"，而是"比例推断假设在这种物质上是否成立"。不过，教授补充说：作为一个最终的说明，“任何东西只要剂量足够高都会致癌"这一说法是不准确的——许多物质在超高剂量大鼠实验中并未被证明有致癌性，这说明不是所有物质都有此效应。

一致性类比（Consistency Analogy）：基于道德或法律原则，要求对相似情形给予相同对待。例： “这两种情形在道德相关特征上相似；你在情形 1 中接受了 X 做法；所以你在情形 2 中也应该接受。”

一致性类比在日常生活中极为普遍，甚至在儿童时期就已熟练使用。教授举的例子来自他自己的童年经历：“他得到了一块比我更大的蛋糕！这不公平！我也是你的孩子。"——未明言的结论是：母亲应该给说话者一块同样大的蛋糕。这是一个标准的一致性类比：它的核心是对一致性原则的诉求，认为在道德相关维度上相似的情况应当得到相同对待。注意这与归纳类比的根本区别：归纳类比的问题是"X是否也将会有Z”（事实预测），一致性类比的问题是"X是否应当也得到Z”（规范要求）。

类比论证的常见谬误

错误类比（Faulty Analogy）：主体与类比物在被推断的特征 Z 上并没有足够的相关相似性。关键在于区分相关相似性与表面相似性。

错误类比（Faulty Analogy）：类比物与主体在待推特征Z上缺乏足够的相关相似性——不是"有差异"，而是有相关差异。教授分析了一个枪支管制的类比论证：禁酒令期间，禁止销售酒精并没有显著减少饮酒；因此，禁止持有枪支也不会显著减少枪击事件。类比物是"酒精"，主体是"枪支"，共同特征是"都被禁止"，待推特征是"禁止不会减少使用"。这个类比的第四前提（相似性足以支持推断）是否成立？教授认为可能不成立，因为酒精和枪支存在几个重要的相关差异：(1) 人们可以在家自酿啤酒，但不能轻易在地下室制造枪支；(2) 酒精有成瘾性，而枪支没有，成瘾者有更强烈的动机规避禁令；(3) 人们拥有枪支的动机部分来自"他人也有枪"的恐惧，这是一种循环强化的逻辑，酒精消费没有这种结构。此外，“禁酒期间饮酒没有减少"这个前提本身也可质疑：由于饮酒违法，官方统计数据不可靠，而许多人继续饮酒的事实，并不能证明整体消费量没有下降。

两害相抵（Two Wrongs Make a Right）：一致性类比谬误的一种，论证者本应论证"这件事是对的”，却通过指向另一件更糟糕的事来说"这件事不那么坏"。问题在于：如果两个情形真的相似（如论证者所声称），那么要么两件事都是错的，要么都不是错的。说"A不那么坏，因为B更坏而没人抗议"——如果B真的相似且是错的，那B应该被抗议；如果B不是错的，那A与B的相似性就值得怀疑。两害相抵谬误试图通过比较来降低对A的道德评价，但实际上，这样做只是在回避A本身是否错的根本问题。

滑坡先例（Slippery Precedent）：两害相抵的镜像谬误。论证模式是：“好的，你对这个人的诉求是有道理的，但如果我满足了她，明天就会有一百个没有道理的人来敲我的门，要求同样的待遇。“这个论证的逻辑漏洞是：先例要求的是对相似情形给予相似对待。如果那一百个人的诉求与第一个人在道德相关维度上不相似，那就没有义务同等对待他们——先例不适用于本质上不同的情形。换言之，两害相抵是在为"对相似情形区别对待"辩护，而滑坡先例则是在为"对不相似情形同等对待"辩护。两者在方向上相反，但都是对一致性原则的误用。

一致性类比在法律推理中占据核心地位，因为普通法体系建立在判例（precedent）之上：如果法院在案例A中做出了判决X，那么在道德相关维度上类似的案例B中，也应当做出类似的判决。法律类比论证的精髓在于：论证案例A与案例B之间的道德相关相似性——不是表面上都是"人身伤害”，而是在过失责任、知情同意、信托关系等法律相关维度上具有真正可比性。中国法律体系近年来逐渐建立判例引导机制，但在"类比相关性"的精细分析上，与普通法系仍有发展空间——学会识别和批评类比论证，对于理解判决说理具有直接实践价值。

第十七讲：传导论证与结语

大多数现实中的重要决策——医疗、政策、个人生活选择——都不适合用演绎有效论证来分析，因为它们本质上是多维权衡。没有任何一个理由能够在逻辑上"保证"结论的正确性；所有的理由都只是在不同程度上倾向于某个方向，而且往往存在相互冲突的考量。这类推理，正是本讲要讨论的传导论证所试图捕捉的。

传导论证是由加拿大哲学家卡尔·韦尔曼（Carl Wellman）在1975年系统提出的，作为对标准归纳论证框架的补充——他注意到，伦理推理、日常决策和政策判断中大量存在一类特殊论证结构：它不只有支持结论的理由，还明确承认存在反对理由，并声称在两者权衡之后，支持力更强。这种承认反对意见的坦诚，恰恰是传导论证区别于谬误（尤其是"虚假二分法”）的重要标志——它不是在假装只有一面，而是在明确地做多维权衡。

传导论证（Conductive Arguments）

传导论证是一种特殊的非演绎论证，通过权衡支持考量（pro-considerations）与反对考量（counterconsiderations）来支持结论。

教授在课上用了一个鲜活的场景：你的电话响了。是一家大银行董事会主席打来的——银行利润一直在滑坡，他们想请你担任CEO，年薪两百万美元，给你一小时决定。你会怎么做？支持接受的理由：钱（当然不错）、声望、新衣服（看看你衬衫上的破洞）。反对接受的理由：工时超长（这种钱不是白给的）、朋友们知道你一直在批评银行的利润有多不道德会怎么想、……你还在权衡时，电话再次响起，你给了答案。但你从过去的经验知道：就在你刚刚下定决心的那一刻，你往往会想到一个此前没考虑到的因素，让你感叹"要是早想到这个，我肯定会做出相反的决定！"

这个小故事揭示了传导论证最独特的特征：它始终对其他尚未考虑到的相关因素保持开放。这也是为什么在评估别人的传导论证时，最重要的问题之一是：有没有任何其他相关因素被遗漏了？

结构特征：

多个前提各自独立地提供证据（聚合支持）
明确承认存在反对理由，但声称支持理由更重
结论具有"权衡之下"的性质
始终对未考虑到的其他因素保持开放性

评估传导论证

对每个前提检验：

A 检验（Acceptability）：该前提本身是否可以接受？
R 检验（Relevance）：该前提是否与结论相关？
权衡：支持考量的整体力量是否大于反对考量？

在"权衡"这一步，教授提出了三个实用策略：

识别决定性因素：有时可以识别某个考量具有压倒性优势——例如，如果你刚刚组建了一个家庭，铁打的工作保障可能足以压倒所有其他因素，无论另一家公司的薪水多高。
对考量进行优先级排序：将各考量按重要性排列，而不是简单地数哪边"数量更多"。例如，如果你得知新工作在另一座城市，而配偶强烈希望留在现在的城市——这第三个因素虽然出现得晚，可能足以压倒前两个（薪资更高、餐厅更好）加起来。
保持对其他因素的警觉：始终问自己：还有没有我没考虑到的相关因素？这不是无休止的延迟决定，而是一种认知谦逊——承认传导论证的结论永远可能被新的相关信息所修改。

反对考量与演绎/非演绎的根本差异

在非演绎论证（包括归纳论证和传导论证）中，新的证据可以减弱甚至推翻原本的支持关系。这与演绎论证不同——一个有效的演绎论证，其结构永远保持有效，不受新信息影响。

教授用Rachel的例子说明这一点：

前提1：Rachel在较年轻时生了第一个孩子。前提2：Rachel用母乳喂养了她的孩子。前提3：年轻时生育及母乳喂养降低乳腺癌风险。 ∴ Rachel患乳腺癌的风险较低。

这是一个合理的非演绎论证。但现在加入新信息：

前提4：Rachel有乳腺癌家族史。

这个新前提的加入不是推翻了前三个前提（它们仍然成立），而是使前三个前提对结论的支持力减弱了——家族史是乳腺癌的重要风险因素，足以抵消前三个保护性因素的作用。在演绎论证中，增加新前提永远不能削弱已有前提对结论的支持；但在非演绎论证中，这正是经常发生的事。这就是为什么批判性思考者必须始终愿意用新证据更新结论：不是软弱，而是理性的标志。

这种"可修正性"（defeasibility）是非演绎论证的哲学核心。哲学家约翰·波洛克（John Pollock）在认识论中对此有精彩阐发：一个证据在没有其他信息时，可以充分支持某结论；但一旦有了"例外阻断词"（defeater），这个支持关系就被取消。“那堵墙看起来是红的，所以它是红的”——这是合理的推断。但加上"这里有红色灯光"——支持关系立刻被击垮。传导论证中的权衡，本质上就是在持续地处理这类"例外阻断词"：每一个新的反对考量，都可能影响既有支持关系的强度。这也是为什么批判性思维的核心价值之一是保持开放：在新证据面前更新立场，不是软弱，而是理性的标志。

为什么现实争议需要传导论证

传导论证在两类情境中尤为不可避免。

第一类是时间压力下的个人决定：生活施加了一个硬性截止日期（一小时、一天、一周），我们无法等到所有相关证据都齐全再做决定。不做决定本身就是一种决定（对职位邀约不回应，等于拒绝）。因此我们必须在不完全信息下权衡我们已有的考量，做出最佳判断。

第二类是涉及价值观的公共政策争论：这类问题通常没有演绎有效的解决方案，因为前提本身就涉及价值判断，而价值判断无法仅凭科学证据裁决。教授用堕胎辩论举例：有人论证"杀死人类总是错的；堕胎是杀死人类；所以堕胎总是错的"——这看起来像一个演绎有效论证。但仔细分析，“人类”（human being）在P1中意味着"有人格权的道德存在"，在P2中仅仅意味着"具有人类生物特征的存在"——这是歧义谬误（第八讲）的典型。如果修正这个歧义、使论证真正有效，辩论就会转移到"什么是P1中’人’的正确定义"——而这本身就是一个争议性的价值问题（杀死战争中的士兵算吗？拔掉脑死亡患者的生命维持设备算吗？）。

关键的洞见是：现实中重大争议问题之所以没有被演绎有效论证解决，不是因为参与争论的人太蠢没有找到那个论证，而是因为在这些问题上，从各个方向都有合理的支持理由，没有任何一方拥有一个前提全部可接受且有效的论证。这不等于说没有好坏之分——某些立场确实考虑得更周全，某些论证确实更强。但承认争论的另一方也有一些合理的考量，是理性讨论的前提条件，也是不把"不同意我的人都是道德败坏者"这一错误防止的关键。

课程总结：理性是一种勇气

从苏格拉底到王阳明：两条殊途同归的思想河流

批判性思维作为一门现代课程，拥有惊人漫长的前史。西方这条线索，我们已经在课程中反复触碰：苏格拉底在雅典广场上发明的诘问法（elenchus），本质上就是一部逻辑谬误的活教材——他从不直接宣布真理，而是通过层层追问，将对方论证中的内在矛盾暴露出来，直到对方意识到自己"一无所知"。柏拉图在此基础上建构了意见与知识的区分：感官印象是易错且片面的，真正的知识必须能够在理性审视下自我辩护。亚里士多德则将这种直觉系统化，写下了人类第一部逻辑学著作，第一次将论证的有效性与前提的真实性区分为两个独立的评估维度——这正是本课程第四讲的核心命题。

中国哲学的历史中，也存在一条虽不完全平行、却同样深刻的思辨传统。先秦时代的名家（以公孙龙、惠施为代表）对概念的本质与语言的边界有着极度敏锐的兴趣——“白马非马"“坚白石"这些命题，本质上是对定义（第九讲）与歧义性（第八讲）的哲学探索。墨家更是发展出了中国古代最接近形式逻辑的推理体系：《墨辩》中对"辩"的定义（“辩，争彼也，辩胜，当也”），对"同"与"异"的细致分类，以及对类比论证有效条件的讨论，与本课程第十六讲的类比论证理论遥相呼应。墨子本人则在《兼爱》《非攻》诸篇中，以罕见的严整结构展开论证——他先确立衡量政策好坏的标准（利国、利民、利世），再将该标准一致地应用于攻伐与兼爱两种行为，这正是本课程反复强调的逻辑一贯原则的古典示范。

宋明理学的朱陆之辩是中国思想史上最重要的哲学论争之一：朱熹主张"格物致知”，认为真知必须经由对外部事物的系统观察与推理逐渐积累；陆九渊则坚持"心即理”，认为真理内在于人心，无需经由外部论证获得。这场争论触及的，正是本课程第十三、十四讲的核心问题：经验证据在建立知识中扮演什么角色？直觉与推理各有怎样的认知地位？王阳明晚年提出的"知行合一"，在某种程度上可以被理解为对这一张力的实践性回应：真正的知识不是脑中的命题，而是已经被行动检验过的理解——这与当代认知心理学中"认知与行为互相建构"的洞见有着深刻的共鸣。

五项核心技能的哲学根基

回顾这门课程所传授的五项技能，我们会发现每一项背后都有更深的哲学基础：

分析论证结构，是在实践柏拉图对意见与知识的区分。当我们将一段话拆解为前提与结论，我们实际上是在追问：这个主张的支撑是什么？它能够在理性审视下自我辩护吗？孔子在《论语》中反复使用的一种对话模式——弟子提问，孔子先厘清问题的真实意涵，再给出回答——也是这种分析习惯的古典体现：在评估一个主张之前，先确保自己理解了它说的究竟是什么。

评估推理有效性与前提真实性，是在实践亚里士多德的基本洞见：一个论证可能在形式上无懈可击，却建立在错误的前提之上；也可能前提真实，却推导过程存在漏洞。这两个维度相互独立，必须分别检验。《庄子·齐物论》中有一段著名的文字：“以指喻指之非指，不若以非指喻指之非指也”——这句话在哲学上的意义，正是提醒我们区分"用自身来证明自身"（循环论证）与"用外部标准来验证主张"（独立证据）之间的根本差异。

识别非形式谬误，是在培养一种对语言策略的警觉。荀子在《正名》篇中提出"名者，所以期累实也"——名称与实物之间的对应关系不是天然的，而是约定俗成的。正因如此，语言可以被操纵：通过模糊的名称（歧义）、情感色彩的词汇（说服性定义）、或者替换关键词的含义（偷换概念），论证者可以在不撒谎的情况下误导听者。荀子的这一洞见，为本课程第八、九讲关于语言与定义的讨论提供了深厚的哲学背景。

形式逻辑工具——命题逻辑与谓词逻辑——在哲学史上代表着一种激进的抱负：用一套与自然语言完全剥离的符号系统，把所有有效的推理模式一网打尽。莱布尼茨在17世纪梦想建立一种"通用语言"（characteristica universalis），将所有的真理争论都转化为可计算的符号演算。这个梦想直到弗雷格、罗素才得到部分实现。它的意义不在于我们将在日常生活中使用逻辑符号，而在于它强迫我们意识到：自然语言中大量"看起来合理"的推理，在形式化之后会立刻暴露出谬误。

经验推理——统计、因果、类比——则把理性带入了最混乱的领域：我们如何从不完整的信息中做出尽可能好的判断？休谟在18世纪提出的归纳问题，至今仍是哲学上最深刻的未解之谜之一：无论我们观察了多少次"太阳从东方升起"，这都不能从逻辑上保证明天的太阳仍会如此——归纳的有效性本身无法被演绎地证明。本课程第十三、十四讲处理的统计论证与因果推断，正是在这个背景下工作：我们不追求确定性，而是追求在现有证据下最理性的判断，并保持在新证据面前修正立场的意愿。

教授的期待：不止于自我防御

在课程的最后，教授坦率地说出了他上批判性思维课时最朴素的愿望。第一个愿望是显而易见的目标：希望学生能够评估别人向他们提出的论证，发展出识别好坏推理的技能。

但第二个愿望更难得、也更深刻：他希望学生能够建立起对自己推理能力的信心。这种信心带来的好处是：愿意去正面应对那些与自己意见相左的人的论证，而不是躲在逻辑自卫的盾牌后面。教授明确说：他不喜欢批判性思维只是"逻辑自卫"这一说法——仿佛它是一种帮你抵御广告商和政客欺骗的防御工事。当你有了批判性思维的技能、又有了相应的信心时，你获得的不只是防御自己的能力，而是开放自己接受改变可能性的能力。

“批判性思维不只是一种保护你’现在的自己’不被改变的工具，而是一种让你变得更好的方式。”

理性的最终形态：一种改变立场的勇气

这门课程给出了一个奇特的最终目标：不仅能够批判地评估他人的论证，更能在充分的证据面前，有信心改变自己的立场。

这个目标奇特，因为它将"改变"而非"坚守"确立为理性的标志。在许多文化背景下，坚持立场被视为有骨气，而改变立场则被解读为软弱、妥协、甚至被收买。但批判性思维的传统对此有着截然不同的判断。苏格拉底在雅典法庭上被判处死刑，部分原因正是他让太多人意识到了自己的无知——而这些人，恰恰无法承受自己立场被理性检验后的结果。约翰·斯图亚特·穆勒在《论自由》中写道：“不曾亲自面对反驳意见的人，并不真正理解自己的观点。” 一个从未认真听取过对立论证的人，只是占据着一个立场，而不是真正持有一个观点。

在中国思想传统中，有一个类似的境界值得援引。《礼记·学记》中有一句话：“独学而无友，则孤陋而寡闻。“但更深层的挑战不是缺少讨论伙伴，而是在讨论之后能否真正被好的论证所改变。孟子在与告子、公都子等人的辩论中，多次修改了自己的措辞甚至立场——他并非软弱，而是因为他真正在意的是道理本身，而非在辩论中获胜的面子。这种把"从善如流"视为美德而非失败的态度，恰恰是批判性思维伦理核心的中文表达。

理性不是一套技巧，也不是一种武器。它是一种与真实世界打交道的诚实方式——承认自己有可能错，愿意被更好的证据说服，并在面对复杂现实时拒绝轻易满足于简单答案。在一个充斥着逻辑谬误、情绪操控与话语策略的世界里，保持这种诚实，是一种真正的勇气。

扩展章：中文语境下的批判性思维

本课程前十七讲的案例大多来自英语学术传统。这种倾向有其合理性——批判性思维作为现代教育标准，确实源自西方哲学脉络——但它也带来了一个不容忽视的缺憾：我们每天真正遭遇的逻辑陷阱，往往藏身于微博热搜、群聊转发、职场会议与法庭判决书之中。理论若不能在真实语境中落地，批判性思维就只是一门考试科目，而非一种生活方式。

本章以两个视角切入：其一是历史与翻译——理解"批判"二字本身为何构成障碍；其二是实践——以中国社会现实中高频出现的案例，系统演练二十二种核心逻辑谬误的识别与分析。

本章内容综合自以下两个视频，特此致谢：

柏拉图的石头，「一口气看懂"批判性思维”——45分钟了解批判性思维的前世今生」。涵盖：批判型思维的哲学史、κρίνω 词源追溯、日本明治维新对西学翻译的改造、批判型思维与东亚儒家伦理的根本张力。

柏拉图的石头，「一口气看懂22个逻辑谬误——45分钟了解逻辑谬误」。涵盖：非形式谬误的四大分类框架、22种逻辑谬误的中文社会语境案例（含2007年南京彭宇案的完整逻辑解剖）。

一、“批判"从哪里来：一个被误译的核心概念

每当有人听到"批判性思维"五个字，脑海中往往会浮现出一种带有攻击性的否定姿态——批评某人、否定某事、唱反调。这种直觉并非空穴来风；它恰好揭示了一段有趣的翻译史。

古希腊词根：κρίνω

英文 critical thinking 的词根来自古希腊动词 κρίνω（krinon），其核心含义是"分辨、区分、筛选、评判、决定、审视”。在古希腊的政治、哲学与文学传统中，这个词承载的是冷静、审慎的判断能力。荷马史诗《伊利亚特》第十八卷中，阿喀琉斯在得知好友帕特洛克洛斯战死后，必须在"短暂而辉煌的英雄之死"与"长寿却无名"之间做出根本选择——这场景中用以描述英雄抉择的正是 κρίνω：它不是简单的赞扬或批评，而是"对自身命运、道德价值和存在意义的最终决断”。

这个词根经由拉丁语 criticus，进入法语 critique、德语 Kritik、英语 critical，其核心含义始终是理性分析与审慎判断，而非否定或抨击。康德的三大"批判"——《纯粹理性批判》《实践理性批判》《判断力批判》——所用的 Kritik，是对理性能力及其界限的系统检验，是一场哲学革命。若要更贴近原意，或许应译为"纯粹理性的检验"。

日本的二传手角色

“批判"进入汉语，并非直接来自西方，而是绕道经过了日本明治维新的翻译实验。19世纪末，日本学者井上哲次郎在编撰《哲学字汇》时，以"批评"作为法语 critique 的标准译名，持续了约二三十年。进入20世纪后，随着马克思主义哲学在日本学界渗透，“批判"逐渐取代"批评”，被赋予了更强的结构性、对抗性内涵——阶级批判、社会批判、意识形态批判。二战后，法兰克福学派的批判理论进入日本主流学界，“批判"遂彻底固定为否定性术语。

这种语义漂移意味着：当 critical thinking 随着中国学界对日本翻译路径的依赖，被沿用为"批判型思维"时，它所携带的已不再是古希腊 κρίνω 的中性判断义，而是夹带了否定、揭露问题、攻击的负面色彩。结果是，我们学的是一种旨在培养审慎分析能力的思维方式，却给它贴了一个在文化上天然令人警惕的标签。用一句话概括：我们学的是康德，却理解成了鲁迅；我们谈的是理性的界限，却讲成了情绪的对立。

日本翻译策略的深层政治逻辑

明治维新时代，日本当局对西方思想的引进持着深度矛盾的态度：一方面想引进西方制度以强国，另一方面又担心西方激进思想引发社会动荡，威胁天皇权威。这导致了许多西方概念在进入日本时，被刻意"温和化”——进行一种文化适配，去除与儒家意识形态相悖的激进主张。

几个典型案例清晰地展示了这种翻译策略：revolution（革命）被翻译为"维新”（如"明治维新"），弱化了彻底颠覆旧秩序的含义；“民主"被译为"民本主义”，暗示权利来自天皇恩赐而非天然人权；“宪法"变为"大日本帝国宪法”，将宪政民主嵌入天皇至上的框架之内。

正因如此，整个东亚学术界——包括通过日语翻译接受西方哲学的中国——实际上接受的，是一套被日本重新包装过的西方思想体系。批判性思维，就是这套体系中被最深刻地误读的概念之一。

批判性思维应当如何理解

若遵循"归义翻译"的原则，critical thinking 的准确译法更接近"逻辑应用与智性品德"——它既包含形式逻辑的工具层面，也包含思维伦理的价值层面。具体而言，一个成熟的批判性思考者应当具备以下标准：

维度	标准	说明
认知	符合逻辑与事实	结论建立在可验证的推理基础之上
认知	审慎	在结论之前确保推理基于足够证据
品德	保持勇气	不畏权威、不畏主流意见、坚持探寻真相
品德	保持谦逊	承认自身知识的有限性，乐于接受更好的论证
品德	公正客观	不偏不倚地评估所有立场，包括与自身利益相悖的立场
品德	保持独立自主	不轻易被权威或既成答案裹挟
品德	保持好奇	对未知领域保持求知欲望，而非满足于标准答案
品德	坚持不懈	面对复杂困难，不浅尝辄止
伦理	同理心	尝试理解对方的背景与逻辑，而非单方面出发
伦理	逻辑一贯	不因自身利益随意歪曲事实，不使用双重标准

二、理性精神与儒家伦理的根本张力

理解批判性思维在中文语境中的推广困境，需要正视一个比翻译更深层的问题：这套思维方式与东亚社会长期主导的儒家伦理之间，存在着价值目标上的根本矛盾。

两种伦理系统的正面交锋

批判性思维以怀疑为出发点：质疑权威、追问前提、反思自我，将上帝、国家、政府、家庭、传统、学术权威全部纳入可质疑的范围。这不是破坏性的姿态，而是理性自由的基本条件——康德在《什么是启蒙》中称之为"敢于使用自己的理性"。

儒家伦理的核心则截然相反：它以敬重为本，以守礼尊师、慎言为教，强调在信任的基础上建立判断。这不是说儒家排斥思辨，但它规定了思辨的边界——你可以思辨，但你不能破坏社会的伦理结构。

这一差异在课堂上表现得最为直白：当一位中国学生对老师说"你这个论点逻辑不通"，在西方课堂中，这是值得鼓励的批判性思维实践——亚里士多德曾说"吾爱吾师，吾更爱真理"；但在东方文化情境中，同样的行为可能被认为"缺乏尊师重道"。此时，逻辑结构本身是中立的，但社会对使用逻辑工具的文化规训，才是真正的障碍。

胡适与中国语境的错位

20世纪初，约翰·杜威的学生胡适将批判性思维的雏形引入中国，以"大胆假设、小心求证"为口号。然而，胡适所理解的理性批判，本质上是杜威实用主义在中国的简化版——他将理性批判本应具备的结构性批判能力，转变成了一种温和的修辞倡议，落入了"将传统包装成现代"的路径，而非真正的思想转型。

这并非胡适一人的局限，而是整个东亚文化圈在面对西方现代性冲击时，所表现出的集体性结构焦虑的缩影——在学习西方与保存传统之间的反复摇摆，在方法引进与价值自守之间的深层张力。

当代东亚的深层困境

这种张力至今未能消解。即便是率先完成制度现代化的日本，其公民是否可以真正公开质疑天皇存在的合法性？批评天皇在政治语境中仍被视为离经叛道，这种不可置疑的权威残余，对公共理性的生成构成核心内在障碍。

推广批判性思维，在东亚社会归根结底触及的是一个道德与政治哲学问题：我们是否允许一个人挑战他的老师？我们是否允许一个人质疑他的父母、推翻他的前设？我们是否愿意把"说出不同意见"从道德上的无礼，转变为一种值得鼓励的行为？

若这些基础问题不被正视，所谓思辨能力的培养，终究沦为形式主义的训练——逻辑正确、言语犀利，却始终不敢指向真实的权力与社会传统。

三、非形式谬误的中文语境拆解

本节将二十二种最常见的逻辑谬误组织进四个类别，配以大量鲜活的中文语境案例——这些案例来自社交媒体、广告营销、法庭判决、政治演讲与日常对话。分类框架为：相关性谬误、以偏概全与因果谬误、预设前提谬误、模糊与歧义谬误。

第一类：相关性谬误

相关性谬误的共同特征是：前提与结论之间缺乏真正的逻辑联系，但借助情绪、身份、权威或修辞包装，让这种关联在心理上显得成立。其核心公式是：非本质因素 X 无法从逻辑上推导出结论 C，但 X 能够让人们在心理上接受 C。

1. 人身攻击（Ad Hominem）：不针对对方的论点反驳，而是攻击论证者的个人特征、动机或其他与论点无关的方面。

中文网络案例：当有人提出"应提高国产药疗效标准"，对方回应"你看不起国产，你崇洋媚外"——这并未回应论点，而是借助道德标签发起人身攻击。

变体——情境式人身攻击：指出对方的利益关系，暗示其观点不可信。“他是某品牌代言人，他说这产品好是广告费买的。“这可作为审慎的参考，但不能直接推翻论证内容。

变体——以彼之矛（Tu Quoque）：“你自己也不是这样做的。“指责言行不一，却回避了对方观点是否正确的问题。

2. 诉诸大众（Ad Populum / Bandwagon）：以"大家都认为"作为论据，将多数人的信念等同于正确性。

中文语境：电梯广告中常见"深受百万家庭信赖"“畅销十年口碑见证"“更适合中国人体质”。广告行业将此策略称为"占领用户心智”：通过高频重复简单口号，制造"主流共识"的印象，绕过个体的独立判断。主流观点仅仅是主流而已，是否为真需要具体分析。

3. 诉诸权威（Appeal to Authority）：引用权威作为决定性论据，但该权威并非相关领域专家，或专家之间存在明显分歧。

中文语境：社交媒体上的测评博主声称某平替"吊打旗舰”，当大量头部博主覆盖了该品牌广告，受众的判断便从产品质量转移为"这么多人推荐应该不会差”。权威绝不能与正确画等号；博主、网红甚至院士的意见都只是参考，而非替代独立判断的理由。

4. 诉诸情感（Appeal to Emotion）：用强烈的情绪——悲悯、愤怒、自豪——来遮蔽本应接受逻辑检验的推理过程。

中文语境：每逢重大社会事件登上热搜，大量网友的第一反应是共情。但一旦有人提出"新闻内容是否属实？表述是否被剪辑？"，便遭到"你在洗地"的反击。情感认同本身不能证明叙述正确——这是一种"以善为名的非理性”，正因诉诸了道德情感，反而更难被识破。

5. 诉诸恐惧（Appeal to Fear）：通过制造严重后果的威胁，胁迫听者放弃理性判断。

中文语境：伪科普内容的标准话术结构为"如果你不做A，后果可能是B”——典型如"研究发现，90%的脑出血都和你忽略的这10个习惯有关（最后一个尤为关键）"。这类推送完全跳过了因果链条和证据检验，只依靠高强度的焦虑感迫使行动，是一种以忠告为名的理性劫持。

6. 稻草人谬误（Straw Man）：歪曲、简化或极端化对方的真实观点，攻击一个伪造的"假目标"，回避对原观点的真实回应。

逻辑结构：“我无法辩驳真实观点 A，于是我伪造了一个更愚蠢的版本 B，再用力打倒 B，装作自己赢了。"

中文语境——叠加效应：稻草人谬误往往与诉诸大众叠加：先歪曲对方观点，再动员他人围攻。“当你呼吁理性讨论家暴”→被说"你在为施暴者洗地”；“当你说高校应提高论文质量”→被说"你反对学术研究"。你并未说错任何东西，却被塑造成一个"什么都说错"的形象。

7. 诉诸传统（Appeal to Tradition）：以"自古如此"作为论据，认为某做法因其历史悠久而正确。

中文语境：“多喝热水有益健康"几乎是全民共识，听起来非常像经验之谈，但频繁饮用过热的水会增加食道黏膜损伤的风险，而非提高免疫力。传统与正确并不等价；一个行为被重复了几百年，并不能成为它有效的证据。

8. 诉诸身份认同（Identity / Pride Appeal）：将本应基于事实与推理的判断，转移到情感归属、民族身份或集体意志之上。

历史案例：1907年日本流行"吃面包会亡国"论——购买面包等同于"崇洋媚外、不忠于国家”。消费选择被包装成道德审查。类似逻辑至今可见：将"质疑某国产产品质量"偷换成"不爱国"，把本该基于产品标准的判断，替换为情感归属的表态。

历史警示：纳粹德国以"日耳曼民族荣耀"代替对战争正义性的讨论；日本以"天皇是神"代替对军国主义的质疑。当身份凌驾于推理之上，人就不再是自由的判断者，只是民族机器上的齿轮。

第二类：以偏概全与因果谬误

这一类谬误的问题在于：归纳的样本不充分，或因果关系的推断存在根本性错误。

9. 草率概括（Hasty Generalization）：从数量太少或不具代表性的样本出发，得出关于整体的结论。

中文语境：社交媒体上的"亲测有效"文化是这一谬误的温床——“我身边三个人用了这个减肥药都成功了，所以肯定有效。“三个朋友不构成科学样本；如果这三人同时调整了饮食和运动习惯，因果归因就已经出错了。

10. 因果倒置（Reverse Causation）：将因果关系的方向弄反——把结果当成原因，或把伴随现象当成先行原因。这是肯定后件谬误（若 A 则 B；B；∴ A）在现实中的常见变体。

中文语境：“努力就能成功，付出就有回报”——这个表述暗示"只要努力就会成功”，忽略了运气、资源、结构性机会等变量。成功与努力存在相关性，但单向因果推断是谬误，它还额外隐含了一个对失败者的残酷逆推：没有成功，是因为不够努力。

11. 事后谬误（Post Hoc Ergo Propter Hoc）：仅仅因为 B 在 A 之后发生，就认定 A 导致了 B。

中文语境：微信群养生谣言的标准结构是：某人每天做某事 → 健康改善 → ∴ 该事有效。没有对照组，没有排除混淆变量，就建立了因果主张。这类"个案即证据"的思维方式，是中文网络健康谣言得以广泛传播的逻辑基础。

12. 赌徒谬误（Gambler's Fallacy）：认为过去的随机事件会影响未来独立事件的概率。

中文语境：“这道高考题今年考了，明年肯定不会再考。“独立事件的概率不受历史影响；过去的结果不能预测未来的独立事件。这一谬误在博彩、彩票以及考试备考策略中极为常见。

13. 滑坡谬误（Slippery Slope）：声称某行动会导致一系列不可避免的灾难性后果，但缺乏充分证据表明这一"滑坡"确实会发生。

中文语境：“如果允许学生质疑老师，课堂纪律就会崩溃，教师权威就会消失，最终教育就会彻底失去方向。“每一步跳跃都需要独立的因果证据；在没有证据的情况下，声称 A 必然导致 B 再导致 C，是情绪化的论证策略而非逻辑推理。

14. 德克萨斯神枪手谬误（Texas Sharpshooter Fallacy）：从大量数据中挑选出与结论一致的部分，忽略其余数据，再宣称这些被选中的数据"支持"了结论——如同向谷仓乱射一通后，在弹孔密集处补画靶心。

中文语境：某保健品宣称"临床实验中67%的受试者服用本品后肿瘤标志物下降”，却未提及对照组数据、是否统计显著、是否经同行评审。选择性呈现数据，是中文健康传播领域最常见的逻辑陷阱之一。

第三类：预设前提谬误

这一类谬误更隐蔽：问题不在于推理的表面结构，而在于论证一开始就偷偷预设了尚待证明的结论，让听者根本没有反驳的机会。

15. 循环论证 / 乞题（Circular Reasoning / Begging the Question）：将结论（或其等价表述）暗藏于前提之中，用待证之事来证明自身——好像结论在推理开始之前就已经被确定了。

中文语境：“传统中医有几千年历史，一直被中国人使用，所以它肯定有效。“这里前提（几千年使用）并不独立地支持结论（有效），因为两者之间的桥梁——“被长期使用的东西通常是有效的”——本身就是需要证明的预设。

16. 诉诸无知（Appeal to Ignorance）：以"没有证据证明 X 不存在"来论证"X 存在"，或反过来，以"没有证据证明 X 存在"来论证"X 不存在"。没有反证，不等于反面结论为真。

中文语境：“你能证明这个偏方没有效果吗？既然不能证明没效果，说明它可能有效。“这将举证责任完全倒置——不能证伪某主张，并不构成该主张为真的证据。主张某事有效的一方，才应当承担证明的责任。

17. 假二分法（False Dichotomy）：将实际上有多种可能的问题，错误地简化为只有两种选择。

中文语境：“你要么支持这个政策，要么就是不爱国。“中间存在大量可能：支持政策目标但反对执行方式、支持部分条款但反对整体框架、对政策持保留意见但依然热爱国家。二元对立框架往往是制造舆论压力、封堵理性讨论的修辞策略。

18. 完美主义谬误（Nirvana Fallacy）：因为一个方案不完美，就否定其价值，暗中假设存在一个完美的替代方案。

中文语境：“这个环保政策会影响部分就业，所以不值得推行。“这一反驳隐含了"只有零代价的政策才值得推行"的前设——但现实中所有政策都存在权衡。拒绝接受任何有成本的解决方案，等于拒绝接受一切解决方案。

19. 沉没成本谬误（Sunk Cost Fallacy）：因为已经投入了时间、金钱或精力，而继续坚持一个本应放弃的决策。

中文语境：“我已经追这部剧追了三十集了，虽然越来越无聊，但还是看完吧。“已经投入的时间无法被回收；继续看下去的唯一合理理由应该是"接下来值得看”，而非"之前已经看了很多”。在职场或投资中，这一谬误的代价更为真实：亏损的项目不应因为"已经投入太多"而继续烧钱。

第四类：模糊与歧义谬误

这一类谬误隐藏在语言本身之中：词语含义的模糊、刻意的概念转换，或情感色彩的操控，使论证表面上言之成理，实则偷梁换柱。

20. 偷换概念（Equivocation）：论证中某个关键词在不同位置使用了不同含义，却被当作含义相同来对待。

中文语境：将"质疑某一具体国产产品的质量"偷换成"不支持国货”，再偷换成"不爱国”——每次偷换都悄悄扩大了批评的指向，最终让一个关于产品标准的合理讨论，变成了一项道德指控。这种多步偷换是网络舆论中最常见的论证污染手段之一。

21. 情感用语谬误（Emotive Language Fallacy）：使用带有强烈情感色彩的语言描述中性事实，让听者误以为接收的是客观描述，实则接受了一种被包装过的价值判断。

这种谬误最大的危险，在于模糊了描述性语句与评价性语句的边界——让人们以为自己在看事实，实际上只是接受了一套情绪剧本。

中文语境：将涉案老人描述为"年余古稀却反咬好人"“恩将仇报”，配以"傲慢"表情的特写照片——读者以为看到的是事实报道，实际接受的是预先设定好的道德判决。这类手法在自媒体流量营销中尤为严重：连基本案情是否经过二审都不确认，便急于打造"好人被冤枉的典型案例”，以流量逻辑替代新闻逻辑。

22. 合成谬误与分割谬误（Composition & Division Fallacies）：

合成谬误：因为部分具有某属性，就认为整体也具有该属性。例：“团队里每个成员都是顶尖人才，所以这个团队一定非常优秀。"（团队合作效率与个人能力是独立变量）

分割谬误：因为整体具有某属性，就认为每个部分也具有该属性。例：“中国是世界第二大经济体，所以中国人都很富有。"（经济总量与个体财富分配是两个不同层次的命题）

中文语境：地区性偏见往往依赖分割谬误——“某省经济发展迅速，所以这个省的人都很精明能干”，以整体特征推断个体属性，是日常歧视性言论中最常见的逻辑基础。

四、案例研究：2007年南京彭宇案

没有哪一个中国司法案例，像彭宇案这样集中展示了如此多的非形式谬误——不仅出现在一审判决文书的法律推理中，更渗透在随后的媒体报道和公众舆论中。本节以批判性思维的视角，解剖这场全民舆论风暴。

案件背景

2006年11月20日，南京市民彭宇在公交车站扶起摔倒的徐寿兰老人，却被认定为撞人者。2007年7月，南京鼓楼区法院一审判决彭宇赔偿原告四万余元，以"原被告如无关系，彭宇无理由垫付医药费"为核心推理逻辑，引发全国性舆论震荡。值得注意的是，广泛流传的"不是你撞的，你为什么要扶？“这句话从未出现在实际判决文书中——它本身就是一种偷换概念：将法院对垫付行为的因果推理，偷换成了"法院否定助人为乐行为本身”。

判决书中的逻辑谬误

① 以偏概全：判决书认为"原被告素不认识，一般情况下不会贸然借款"，以此推断垫付行为出于赔偿。然而"陌生人之间不轻易借钱"是统计倾向，而非必然规律，尤其在突发事故的特殊情境下更不适用。法官将一般情况当作必然规律，以偏概全。

② 因果倒置（肯定后件）：判决书认为"撞了人 → 会垫付；观察到垫付 → ∴ 撞了人”。但垫付医药费并非肇事者独有的行为，好心人同样可以这么做。从结果倒推原因，完全颠倒了因果方向。

③ 诉诸无知：判决书排除老人自行摔倒的可能性，理由是"双方均未陈述存在原告绊倒或滑倒等情形，被告也未提供反证”。然而没有证据证明自行摔倒，并不等于一定是他人撞倒——举证责任应由做出肯定主张的一方承担。

④ 错误类比：判决书认为，若彭宇真的是借款，“应请无利害关系的其他人证明，或索取借条”，否则不合常理。这将紧急救助情境套用了日常民间借贷的惯例——在紧急情况下，人们往往来不及履行正式借贷手续，两者情境有本质差异。

⑤ 循环论证：判决书认为，真正的见义勇为"应当追肇事者，而非仅好心相扶”；彭宇未追肇事者，故"其行为与情理相悖”。法官先入为主地将"真正的好人会追肇事者"作为前提，再以彭宇未追人来证明他不是好人——结论在推理开始之前就已经预设了。

媒体报道中的逻辑谬误

偷换概念：媒体将判决中"对垫付行为的因果推理"简化为"不是你撞的，你为什么要扶”，把法院的推理过程偷换成了"法院否定助人为乐”，激起了对整个司法系统的道德愤慨。

情感用语：部分报道以"年余古稀却反咬好人"“恩将仇报"等表述，并配以情绪化叙事框架，将复杂的司法纠纷简化为道德剧本，使读者在未见完整证据的情况下就形成了强烈的价值判断。

滑坡谬误：舆论中大量出现"如果这个判决成立，以后谁还敢扶老人→整个社会道德彻底完蛋"“彭宇案让社会道德倒退三十年"等论调。每一步跳跃都缺乏充分的因果证据——个别判决存在逻辑瑕疵，并不必然导致社会道德的全面崩塌。

这个案例的深层启示

彭宇案的价值不在于它的法律结论是否正确，而在于它揭示了一个更深层的问题：当推理过程本身不被信任时，社会信任的基础就会动摇。 真正撕裂社会信任的，从来不是判决结果本身，而是整个推导过程缺乏逻辑说服力。

法律的公信力必须高于任何个体的职业荣誉——不是因为法官不值得尊重，而是因为一个判决之所以值得信任，是因为它能经得起统一标准的推理检验，而非因为它出自某个资深法官之手。这一原则适用于一切公共话语：无论法官、记者还是普通网民，说理的标准只能有一个。

五、逻辑困境：为何谬误在中文网络中如此高效

了解二十二种谬误之后，我们不得不正视一个现实：在中文网络舆论的生态中，逻辑谬误不仅无处不在，更具有某种结构性的有利地位——因为识别谬误的成本，远远高于制造谬误的成本。

说谎者的经济优势

一个说谎者只需一句谎话，便能带偏整个话题。而试图识别谬误的人，需要分析推理结构、核查因果关系、补齐证据链、还要避免被对方带偏节奏。这有点像版权诉讼中的盗版困境：真正的版权方因为维权成本过高，只能抓大放小，放弃追究零散侵权。

我们的大脑也具备类似的"经济思维”：面对一段复杂但听起来尚算有道理的论证，我们往往选择放过它，不是因为缺乏分辨能力，而是深究的认知成本太高了。正因如此，大多数时候我们选择相信直觉，而非启动完整的逻辑推理（参见卡尼曼《思考，快与慢》中关于系统一与系统二的讨论）。

逻辑训练的真正目标

批判性思维课程的价值，不在于记住二三十种谬误的拉丁文名称，而在于建立一种默认的反问习惯：

这个前提和结论之间，有没有真正的逻辑联系？
说话者是在回应论点，还是在攻击论证者本人？
这个因果关系是怎么建立的？有没有可能弄反了？
我现在感受到的情绪，是对推理的反应，还是对推理的替代？
这个"要么……要么……“框架，是否遗漏了其他可能性？

这些问题不需要在每次对话中全部亮出，但应当成为思维的底层习惯。批判性思维的最终目标，正如本课程开篇所说：不仅能够批判地评估他人的论证，更能在充分的证据面前，有信心改变自己的立场。

这种改变立场的勇气，在任何文化背景中，都是理性公民最难能可贵的品质。

附录：核心术语速查

中文	英文	说明
论证	argument	前提 + 结论的推理结构
前提	premise	支持结论的理由
结论	conclusion	论证试图确立的主张
演绎有效	deductively valid	若前提真则结论必然真
归纳强	inductively strong	若前提真则结论很可能真
健全	sound	有效 + 前提均真
有认知价值	cogent	归纳强 + 前提均真
谬误	fallacy	错误的推理方式
模糊性	vagueness	存在边界情形的概念
歧义性	ambiguity	有多个明确含义
充分条件	sufficient condition	A 成立足以保证 B 成立
必要条件	necessary condition	没有 A 就没有 B
操作化	operationalization	将抽象概念替换为可测量指标
传导论证	conductive argument	权衡支持与反对考量的论证

第一讲：导论——什么是批判性思维？

为什么要学批判性思维？

主张的类型

第二讲：识别论证

结论指示词

前提指示词

注意事项

第三讲：复杂论证分析

论证结构

聚合支持 vs. 独立支持

论证标准化程序

第四讲：论证评估标准

1. 推理有效性

2. 前提真实性

ARG 评估框架

常见错误

第五讲：常见论证形式

演绎有效论证形式

常见无效论证形式（谬误形式）

第六讲：非形式谬误（一）

转移注意力（Red Herring）

稻草人谬误（Straw Man）

假二分法（False Dichotomy）

人身攻击（Ad Hominem）

滑坡谬误（Slippery Slope）

第七讲：非形式谬误（二）

循环论证 / 乞题（Begging the Question / Circular Reasoning）

歧义谬误（Equivocation）

草率概括（Hasty Generalization）

偏颇概括（Biased Generalization）

事后谬误（Post Hoc Ergo Propter Hoc）

赌徒谬误（Gambler’s Fallacy）

诉诸权威（Appeal to Authority）

以立场株连（Guilt by Association）

诉诸力量与诉诸怜悯

第八讲：语言——模糊性与歧义性

模糊性（Vagueness）

歧义谬误（Equivocation）

歧义性（Ambiguity）

婉辞与说服性定义

第九讲：定义

定义的类型

属加种差定义法（Definition by Genus and Differentia）

“X 是什么？“问题

第十讲：命题逻辑（SL）——基本连接词

基本连接词

前件与后件

充分条件与必要条件

德摩根定律

第十一讲：命题逻辑证明

基本推理规则

证明无效性

构造性困境的经典运用

第十二讲：谓词逻辑（PL）

基本元素

四种基本命题形式（传统逻辑）

对立方阵（Square of Opposition）

苏格拉底必然一死：一个四步PL证明

模糊性打破经典逻辑：毛发悖论

第十三讲：相关性

基本概念

误差范围（Margin of Error）

相关性的类型

两种统计论证类型

第十四讲：因果关系

因果主张的特征

三种实验设计

评估因果假说的四步程序

辛普森悖论：控制变量时的陷阱

第十五讲：社会科学中的特殊问题

操作化（Operationalization）

研究中的价值偏见

问卷调查的问题

蓄意操控

第十六讲：类比论证

论证结构

两种类型

类比论证的常见谬误

第十七讲：传导论证与结语

传导论证（Conductive Arguments）