测评

批判性思维测试 Vol.1

1 个部分16 道题目

用 16 道基于日常论证、证据与隐含假设的题目，从识别假设、评估推断、发现谬误和判断理由四项子能力上量化你的批判性思维。作答的正确与否会被评定为总分与等级，并附有逐项子能力拆解、逐题结果与解析、优势与成长方向，以及学习步骤。

一套针对现实论证的批判性思维测试，通过 16 道题目测量四项子能力——识别假设、评估推断、发现谬误和判断理由。它将你的作答评定为总分与等级，并展示子能力概览、逐题结果与解析、优势与成长方向，以及学习计划。约需 5–8 分钟。

开始作答

通过本测评你能了解什么

测试结果

根据你在 16 道题目上的得分推断出的等级

熟练

PROFICIENT

稳定的批判性思维，能够权衡证据与假设来评估论证。

进阶中

DEVELOPING

基础已经具备；磨练你阅读证据与假设的方式会助你更上一层。

起步

EMERGING

先从熟悉论证的构造开始；把主张与理由分开会让你更稳。

结果报告示例

PROFICIENT

熟练

你能冷静地权衡证据与假设，评估论证的强弱——稳定而可靠。

通过

总分

100/ 100

答对

16/ 16

前

95%ile

正确率

100%

总分与及格线

100

能力概览

你在各能力维度上的得分（满分 100）

逐维度分析

找出论证所依赖的未言明假设。关键是寻找那个一旦不成立、结论就会崩塌的条件。

判断结论从既有证据中得出的牢固程度。关键是不过度延伸，也不把相关误当作因果。

发现日常论证中的漏洞。熟悉人身攻击、假两难、循环论证等套路，能让判断更稳。

判断一个理由对某主张而言是相关而有力，还是薄弱而无关。关键是让系统性证据的权重高于个案或人气。

你的优势

你能把主张本身的内容与其背后理由的强弱区分开来。

你能区分相关与因果，并判断证据支持到什么程度。

你对论证中潜藏的隐含假设和谬误有一双慧眼。

下一步挑战

满分——做得很好。接下来试试需要权衡多个相互竞争、更为纠缠的理由的题目。

养成习惯，在你读到的新闻和广告中找出一个隐含假设或谬误。

把同样的批判眼光转向自己的观点，审视对立一方的理由。

详细分析

本测试从几项子能力上测量批判性思维。你达到了熟练等级，在识别假设、判断证据支持程度和评估论证方面把握稳健。你的子能力优势与薄弱之处，直接体现在上方的概览与逐题结果中。对于任何做错的题目，回到它的解析中重走一遍“为什么这个选项最有依据”，满分便触手可及。请继续抵御有说服力的措辞以及诉诸大众或诉诸权威。

题目回顾

○

“这条路通往车站，所以我们快点走吧。”要让这话说得通，说话人必须默认什么？

正确答案: C) 我们想要（或需要）去车站。

只有当我们确实想去或需要去车站（C）时，“所以快点走吧”这个结论才说得通；如果我们并不想去，就没有理由赶时间。A 没有被提到，B 无法从“这条路通往车站”推出，D 也没有被主张——这些都不是该论证所依赖的假设。

○

“我问了三个从这家餐厅出来的人，三个人都点了拉面。”仅凭这一点，最站得住脚的说法是什么？

正确答案: B) 至少这三个人点了拉面。

唯一能确定的是被问到的这三个人点了拉面（B）。仅凭三个人就对整家餐厅下结论——“只卖拉面”（A）、“大多数顾客”（C）或“是拉面店”（D）——都是从极小样本作出的无依据跳跃。

○

“他在批评那种健康方法，但他只是个外行，连医生都不是——所以他肯定错了。”这个论证的漏洞是什么？

正确答案: D) 它攻击说话人的身份，而非主张本身的内容。

一个主张是否正确应当依据其内容来判断，但这里却因为“是谁说的”（“只是个外行”）而否定它。这是人身攻击（D）。外行也可能是对的。这里既没有假两难（C），也没有证据过多（A）。

○

支持“这座桥是安全的”这一主张，最有力（最相关）的理由是哪一个？

正确答案: A) 上个月一家专业检测机构测量了它的承载力，结果远超标准。

最直接支持“是否安全”的是专业的承载力检测（A）。深受喜爱（B）、看起来新（C）或没听说过事故（D，属传闻／诉诸无知）作为结构安全的证据都薄弱或无关。

○

“投放新广告之后销量上升了，所以我们应该增加广告预算。”这个论证依赖的未言明假设是什么？

正确答案: B) 销量的上升主要是那则广告带来的。

“增加广告预算”这个结论依赖于销量上升是由广告造成的，而非由季节性等其他因素造成（B）。如果这个假设不成立，加大投入的理由就站不住脚。A、C、D 即使为假，论证也照样成立，所以它们都不是它所依赖的假设。

○

“一项调查发现，吃早餐的孩子往往成绩更好。”最谨慎、最站得住脚的推断是什么？

正确答案: C) 早餐与成绩之间存在关联，但仅凭这一点无法确立因果关系。

相关不蕴含因果——可能有第三个因素（如家庭环境）同时驱动两者，所以仅凭这项调查无法确立因果（C）。A 假定了因果，D 把“往往”夸大成“总是”，B 则把结论反了过来——都是过度延伸。

○

“这款补剂真的有效——毕竟一大堆人都在买，还是销量第一。”哪一项最准确地描述了这个漏洞？

正确答案: A) 它把人气（很多人在买）当作有效的证明。

“卖得好，所以有效”把人气误当作有效的证据——这是诉诸大众（从众）谬误（A）。销量可能是营销或价格带动的，并不能保证功效。这里既没有借助专家权威（B），也没有话题转移（C）或假两难（D）。

○

针对“这个镇应该新建一座图书馆”的主张，最有力的反驳是哪一个？

正确答案: D) 这个镇已经有三座图书馆，而且数据显示它们全都利用率不足。

最有力的反驳是数据表明本镇已有足够的图书馆而需求却很低（D）——它直接削弱了新建的必要性。A 是针对提议者的人身攻击，B 只是指出意见不一，C 是含糊的预测——作为反驳都很薄弱。

○

“这台机器一定能正常运转，因为每日检查没发现问题。”要让这话成立，必须假设什么？

正确答案: D) 凡是检查没查出的问题都不可能发生（该检查能查出一切可能的故障）。

要从“没发现问题”推出“一定能正常运转”，就必须假设该检查能查出一切可能的故障，毫无遗漏（D）。如果它可能漏掉故障，那问题就仍可能潜伏。A、B、C 即使为假也不改变这个逻辑，所以它们都不是必需的假设。

○

Q10

“今年在这个地区，雨伞销量和冰淇淋销量都比去年大幅上升。”能得出什么结论？

正确答案: A) 仅凭这一点，除了雨伞和冰淇淋销量都上升了这个事实之外，得不出别的结论。

两个数字都上升并不能揭示原因（人口增长、经济、天气——都有可能），所以谨慎的结论就只是这个事实本身（A）。B 把相关误当作因果，C 毫无根据，D 则臆测前提中并未给出的天气——都是跳跃。

○

Q11

“如果你不支持我的提案，那你就是不希望这个团队成功。”这里的漏洞是什么？

正确答案: B) 它把选项弄得好像只有“支持它”或“不希望成功”两种。

一个人完全可以反对这份提案却仍希望团队成功（比如更倾向于一个更好的方案），但这个论证把它缩窄成了只有两个选项。这是假两难（B）。它既不是人身攻击（C），也不是循环论证（D）或以偏概全（A）。

○

Q12

支持“每天走路 30 分钟有益健康”这一主张，最有力的理由是哪一个？

正确答案: C) 有几项跟踪数万人、历时多年的研究发现，规律的每日走路与更低的患病风险相关。

最有力的理由是系统性证据——几项大规模、多年的研究（C）。A 是单个个案，B 是诉诸大众，D 是无关的名人（错置的权威）；对一个普遍性主张而言都是薄弱的支持。

○

Q13

“在我们的员工满意度调查中，可以选择远程办公的部门满意度更高。所以如果我们在全公司推行远程办公，满意度应该会上升。”对这个结论而言最关键的假设是哪一个？

正确答案: B) 满意度更高是远程办公本身带来的，而非那些部门的其他特点（比如工作类型）带来的。

要主张推行会提升满意度，就必须假设满意度来自远程办公本身，而非那些部门特有的其他特点（B）。如果它其实来自工作类型之类的因素，那么全公司推行也无济于事。A 反而会削弱这个论证，而 C 和 D 对“满意度会上升”这一点而言并非必需。

○

Q14

某镇安装了监控摄像头，第二年该辖区的犯罪率下降了。同一年，相邻辖区（没有摄像头）的犯罪率下降幅度大致相同。关于摄像头，最站得住脚的推断是什么？

正确答案: D) 既然两个辖区下降幅度大致相同，那下降可能是由摄像头之外的某个共同因素造成的，仅凭这些数据无法确认摄像头的效果。

如果没有摄像头的相邻辖区也下降了大致相同的幅度，那下降很可能源于一个全镇性的共同因素（经济、别的措施），所以这里显示不出摄像头本身的效果（D）。称其“证明了”（A）忽视了对照组反而削弱了它；“毫无影响”（B）又矫枉过正；而 C 是在无视不合意的数据。

○

Q15

“这项政策是对的，因为一位可信的专家这么说。那这位专家为什么可信？因为他支持这项正确的政策。”主要的漏洞是什么？

正确答案: C) 它绕圈子，把结论当作自己的依据（循环论证）。

政策对是因为专家可信，而专家可信又是因为政策对——论证把自己想要证明的那个结论拿来当作依据，形成了一个环。这是循环论证／窃取论题（C）。它既不是仓促概括（A），也不是转移话题（B）或滑坡谬误（D）。

○

Q16

考虑“市里应当拆除旧停车场以新建一座公园”这一主张，权衡正反两方面的理由。最有分量（可能起决定作用）的反驳是哪一个？

正确答案: A) 那个停车场对通往附近医院的紧急运送至关重要，没有替代场地，拆除它可能延误应急响应。

最有分量的反驳表明拆除会造成严重而具体的危害——延误应急响应——且没有替代方案（A），这是一个可以直接与其收益（一座公园）相权衡的有力考量。B 是薄弱的少数偏好，C 是人身攻击，D 是诉诸传统（守旧谬误）——都算不上决定性。

接下来该做什么

对每道做错的题目，回到解析中重走一遍“为什么这个选项最有依据”。

反复练习分辨谬误类型——人身攻击、假两难、循环论证——以杜绝失误。

在日常的文章和广告中练习发现隐含假设、掂量理由的强弱。

本测试是关于批判性思维倾向的参考信息，并非正式资格认证，也不保证实际能力。

适合人群

适合任何想要磨练如何权衡证据、评估论证，或在工作与学习中更具批判性地阅读信息的人。

结果概览

展示总分与等级、四项子能力概览、逐题结果与解析、优势与成长方向，以及后续学习步骤。

本测评共有 1 个部分、16 道题目。

开始后将无法更改语言。如需更改，请在开始前切换。