Terumiu
测评

批判性思维测试 Vol.1

1 个部分16 道题目

用 16 道基于日常论证、证据与隐含假设的题目,从识别假设、评估推断、发现谬误和判断理由四项子能力上量化你的批判性思维。作答的正确与否会被评定为总分与等级,并附有逐项子能力拆解、逐题结果与解析、优势与成长方向,以及学习步骤。

一套针对现实论证的批判性思维测试,通过 16 道题目测量四项子能力——识别假设、评估推断、发现谬误和判断理由。它将你的作答评定为总分与等级,并展示子能力概览、逐题结果与解析、优势与成长方向,以及学习计划。约需 5–8 分钟。

开始作答

通过本测评你能了解什么

测试结果

根据你在 16 道题目上的得分推断出的等级

01
熟练
PROFICIENT

稳定的批判性思维,能够权衡证据与假设来评估论证。

02
进阶中
DEVELOPING

基础已经具备;磨练你阅读证据与假设的方式会助你更上一层。

03
起步
EMERGING

先从熟悉论证的构造开始;把主张与理由分开会让你更稳。

结果报告示例

PROFICIENT

熟练

你能冷静地权衡证据与假设,评估论证的强弱——稳定而可靠。

通过
总分
100/ 100
答对
16/ 16
95%ile
正确率
100%

总分与及格线

及格线 70
100

能力概览

你在各能力维度上的得分(满分 100)

逐维度分析

找出论证所依赖的未言明假设。关键是寻找那个一旦不成立、结论就会崩塌的条件。

判断结论从既有证据中得出的牢固程度。关键是不过度延伸,也不把相关误当作因果。

发现日常论证中的漏洞。熟悉人身攻击、假两难、循环论证等套路,能让判断更稳。

判断一个理由对某主张而言是相关而有力,还是薄弱而无关。关键是让系统性证据的权重高于个案或人气。


你的优势

你能把主张本身的内容与其背后理由的强弱区分开来。

你能区分相关与因果,并判断证据支持到什么程度。

你对论证中潜藏的隐含假设和谬误有一双慧眼。

下一步挑战

满分——做得很好。接下来试试需要权衡多个相互竞争、更为纠缠的理由的题目。

养成习惯,在你读到的新闻和广告中找出一个隐含假设或谬误。

把同样的批判眼光转向自己的观点,审视对立一方的理由。

详细分析

本测试从几项子能力上测量批判性思维。你达到了熟练等级,在识别假设、判断证据支持程度和评估论证方面把握稳健。你的子能力优势与薄弱之处,直接体现在上方的概览与逐题结果中。对于任何做错的题目,回到它的解析中重走一遍“为什么这个选项最有依据”,满分便触手可及。请继续抵御有说服力的措辞以及诉诸大众或诉诸权威。


题目回顾

Q1

“这条路通往车站,所以我们快点走吧。”要让这话说得通,说话人必须默认什么?

正确答案: C) 我们想要(或需要)去车站。

只有当我们确实想去或需要去车站(C)时,“所以快点走吧”这个结论才说得通;如果我们并不想去,就没有理由赶时间。A 没有被提到,B 无法从“这条路通往车站”推出,D 也没有被主张——这些都不是该论证所依赖的假设。

Q2

“我问了三个从这家餐厅出来的人,三个人都点了拉面。”仅凭这一点,最站得住脚的说法是什么?

正确答案: B) 至少这三个人点了拉面。

唯一能确定的是被问到的这三个人点了拉面(B)。仅凭三个人就对整家餐厅下结论——“只卖拉面”(A)、“大多数顾客”(C)或“是拉面店”(D)——都是从极小样本作出的无依据跳跃。

Q3

“他在批评那种健康方法,但他只是个外行,连医生都不是——所以他肯定错了。”这个论证的漏洞是什么?

正确答案: D) 它攻击说话人的身份,而非主张本身的内容。

一个主张是否正确应当依据其内容来判断,但这里却因为“是谁说的”(“只是个外行”)而否定它。这是人身攻击(D)。外行也可能是对的。这里既没有假两难(C),也没有证据过多(A)。

Q4

支持“这座桥是安全的”这一主张,最有力(最相关)的理由是哪一个?

正确答案: A) 上个月一家专业检测机构测量了它的承载力,结果远超标准。

最直接支持“是否安全”的是专业的承载力检测(A)。深受喜爱(B)、看起来新(C)或没听说过事故(D,属传闻/诉诸无知)作为结构安全的证据都薄弱或无关。

Q5

“投放新广告之后销量上升了,所以我们应该增加广告预算。”这个论证依赖的未言明假设是什么?

正确答案: B) 销量的上升主要是那则广告带来的。

“增加广告预算”这个结论依赖于销量上升是由广告造成的,而非由季节性等其他因素造成(B)。如果这个假设不成立,加大投入的理由就站不住脚。A、C、D 即使为假,论证也照样成立,所以它们都不是它所依赖的假设。

Q6

“一项调查发现,吃早餐的孩子往往成绩更好。”最谨慎、最站得住脚的推断是什么?

正确答案: C) 早餐与成绩之间存在关联,但仅凭这一点无法确立因果关系。

相关不蕴含因果——可能有第三个因素(如家庭环境)同时驱动两者,所以仅凭这项调查无法确立因果(C)。A 假定了因果,D 把“往往”夸大成“总是”,B 则把结论反了过来——都是过度延伸。

Q7

“这款补剂真的有效——毕竟一大堆人都在买,还是销量第一。”哪一项最准确地描述了这个漏洞?

正确答案: A) 它把人气(很多人在买)当作有效的证明。

“卖得好,所以有效”把人气误当作有效的证据——这是诉诸大众(从众)谬误(A)。销量可能是营销或价格带动的,并不能保证功效。这里既没有借助专家权威(B),也没有话题转移(C)或假两难(D)。

Q8

针对“这个镇应该新建一座图书馆”的主张,最有力的反驳是哪一个?

正确答案: D) 这个镇已经有三座图书馆,而且数据显示它们全都利用率不足。

最有力的反驳是数据表明本镇已有足够的图书馆而需求却很低(D)——它直接削弱了新建的必要性。A 是针对提议者的人身攻击,B 只是指出意见不一,C 是含糊的预测——作为反驳都很薄弱。

Q9

“这台机器一定能正常运转,因为每日检查没发现问题。”要让这话成立,必须假设什么?

正确答案: D) 凡是检查没查出的问题都不可能发生(该检查能查出一切可能的故障)。

要从“没发现问题”推出“一定能正常运转”,就必须假设该检查能查出一切可能的故障,毫无遗漏(D)。如果它可能漏掉故障,那问题就仍可能潜伏。A、B、C 即使为假也不改变这个逻辑,所以它们都不是必需的假设。

Q10

“今年在这个地区,雨伞销量和冰淇淋销量都比去年大幅上升。”能得出什么结论?

正确答案: A) 仅凭这一点,除了雨伞和冰淇淋销量都上升了这个事实之外,得不出别的结论。

两个数字都上升并不能揭示原因(人口增长、经济、天气——都有可能),所以谨慎的结论就只是这个事实本身(A)。B 把相关误当作因果,C 毫无根据,D 则臆测前提中并未给出的天气——都是跳跃。

Q11

“如果你不支持我的提案,那你就是不希望这个团队成功。”这里的漏洞是什么?

正确答案: B) 它把选项弄得好像只有“支持它”或“不希望成功”两种。

一个人完全可以反对这份提案却仍希望团队成功(比如更倾向于一个更好的方案),但这个论证把它缩窄成了只有两个选项。这是假两难(B)。它既不是人身攻击(C),也不是循环论证(D)或以偏概全(A)。

Q12

支持“每天走路 30 分钟有益健康”这一主张,最有力的理由是哪一个?

正确答案: C) 有几项跟踪数万人、历时多年的研究发现,规律的每日走路与更低的患病风险相关。

最有力的理由是系统性证据——几项大规模、多年的研究(C)。A 是单个个案,B 是诉诸大众,D 是无关的名人(错置的权威);对一个普遍性主张而言都是薄弱的支持。

Q13

“在我们的员工满意度调查中,可以选择远程办公的部门满意度更高。所以如果我们在全公司推行远程办公,满意度应该会上升。”对这个结论而言最关键的假设是哪一个?

正确答案: B) 满意度更高是远程办公本身带来的,而非那些部门的其他特点(比如工作类型)带来的。

要主张推行会提升满意度,就必须假设满意度来自远程办公本身,而非那些部门特有的其他特点(B)。如果它其实来自工作类型之类的因素,那么全公司推行也无济于事。A 反而会削弱这个论证,而 C 和 D 对“满意度会上升”这一点而言并非必需。

Q14

某镇安装了监控摄像头,第二年该辖区的犯罪率下降了。同一年,相邻辖区(没有摄像头)的犯罪率下降幅度大致相同。关于摄像头,最站得住脚的推断是什么?

正确答案: D) 既然两个辖区下降幅度大致相同,那下降可能是由摄像头之外的某个共同因素造成的,仅凭这些数据无法确认摄像头的效果。

如果没有摄像头的相邻辖区也下降了大致相同的幅度,那下降很可能源于一个全镇性的共同因素(经济、别的措施),所以这里显示不出摄像头本身的效果(D)。称其“证明了”(A)忽视了对照组反而削弱了它;“毫无影响”(B)又矫枉过正;而 C 是在无视不合意的数据。

Q15

“这项政策是对的,因为一位可信的专家这么说。那这位专家为什么可信?因为他支持这项正确的政策。”主要的漏洞是什么?

正确答案: C) 它绕圈子,把结论当作自己的依据(循环论证)。

政策对是因为专家可信,而专家可信又是因为政策对——论证把自己想要证明的那个结论拿来当作依据,形成了一个环。这是循环论证/窃取论题(C)。它既不是仓促概括(A),也不是转移话题(B)或滑坡谬误(D)。

Q16

考虑“市里应当拆除旧停车场以新建一座公园”这一主张,权衡正反两方面的理由。最有分量(可能起决定作用)的反驳是哪一个?

正确答案: A) 那个停车场对通往附近医院的紧急运送至关重要,没有替代场地,拆除它可能延误应急响应。

最有分量的反驳表明拆除会造成严重而具体的危害——延误应急响应——且没有替代方案(A),这是一个可以直接与其收益(一座公园)相权衡的有力考量。B 是薄弱的少数偏好,C 是人身攻击,D 是诉诸传统(守旧谬误)——都算不上决定性。


接下来该做什么

对每道做错的题目,回到解析中重走一遍“为什么这个选项最有依据”。

反复练习分辨谬误类型——人身攻击、假两难、循环论证——以杜绝失误。

在日常的文章和广告中练习发现隐含假设、掂量理由的强弱。

本测试是关于批判性思维倾向的参考信息,并非正式资格认证,也不保证实际能力。

适合人群

适合任何想要磨练如何权衡证据、评估论证,或在工作与学习中更具批判性地阅读信息的人。

结果概览

展示总分与等级、四项子能力概览、逐题结果与解析、优势与成长方向,以及后续学习步骤。

本测评共有 1 个部分、16 道题目。

开始后将无法更改语言。如需更改,请在开始前切换。