文章11
标签6
分类3

【第一期】从书评书《乌合之众》

《乌合之众》是早些时候读的书了,不是被推荐,单单是被标题吸引,算是我社会学心理学的启蒙之作。
虽然不是,也没有打算将此作为本业,但是射猎广泛我认为是没坏处的,发现问题也可以锻炼自己的批判性思维能力。

这一期书评是突发奇想写的,当自己的一篇读后感吧。

赶在考试之前把这篇赶出来了,祝自己逢考必过。


褒贬不一

网上对这本书的评价可谓褒贬不一——有人把它奉为圭臬,有人把它贬的一文不值。稍作查阅即可了解,限于篇幅和著作权问题,在此不作列举。

个人看法

背景:实证主义还未形成心理学研究的主流

很多对该书的批评来源于作者在提出很多论点的同时没有给出有力的论据。
这一点似乎可以用时代背景来解释,但依旧是致命的一个问题——这里不扯丧事喜办和批判性思维,因为这本书是「通俗-入门?性读物」,其受众是初学者,教授的知识是需要保证「基本的」正确性的。知识不正确本身可能不是很大的问题,可遇上了初学,就有很多人把它奉为圭臬——可以类比为初学算术时的「1+1=2」。

如果硬要说,这是一个可以改进和进一步延伸的点,希望有更多对实证部分进行补充的专题性读物。

未经实证就被拿来套用是很危险的,会引起一系列可得性反应,进而影响人的认知——除非你阅读的时候就被人指出这个观点的不确定性(或错误)。记得当初阅读的时候有一部分说到“要从实践中学习”,跟别人讨论一致认为这个说法有些失当,无论是因为时效性还是实证问题。

对乌合之众的问题总结到这里,简单提一下我现在在读的《弱传播》一书,个人认为也有类似的问题,作者有取巧的嫌疑。

基本观点总结

1.人一到群体中,智商就严重降低,为了获得认同,个体愿意抛弃是非,用智商去换取那份让人备感安全的归属感。

2.我们始终有一种错觉,以为我们的感情源自于我们自己的内心。

3.群体只会干两种事——锦上添花或落井下石。

4.个人一旦成为群体的一员,他所作所为就不会再承担责任,这时每个人都会暴露出自己不受到的约束的一面。群体追求和相信的从来不是什么真相和理性,而是盲从、残忍、偏执和狂热,只知道简单而极端的感情。

5.我们以为自己是理性的,我们以为自己的一举一动都是有其道理的。但事实上,我们的绝大多数日常行为,都是一些我们自己根本无法了解的隐蔽动机的结果。

6.所谓的信仰,它能让一个人变得完全受自己的梦想奴役。

7.在与理性永恒的冲突中,感情从未失过手。

8.有时不真实的东西比真实的东西包含更多的真理。

9.群众没有真正渴求过真理,面对那些不合口味的证据,他们会充耳不闻…凡是能向他们提供幻觉的,都可以很容易地成为他们的主人;凡是让他们幻灭的,都会成为他们的牺牲品。

10.数量,即是正义。

11.掌握了影响群众想象力的艺术,也就掌握了统治他们的艺术。

12.没有传统,就没有文明;没有对传统的缓慢淘汰,就没有进步。

13.孤立的个人很清楚,在孤身一人时,他不能焚烧宫殿或洗劫商店,即使受到这样做的诱惑,他也很容易抵制这种诱惑。但是在成为群体的一员时,他就会意识到人数赋予他的力量,这足以让他生出杀人劫掠的念头,并且会立刻屈从于这种诱惑。出乎预料的障碍会被狂暴地摧毁。人类的机体的确能够产生大量狂热的激情,因此可以说,愿望受阻的群体所形成的正常状态,也就是这种激愤状态。

14.一个国家为其年轻人所提供的教育,可以让我们看到这个国家未来的样子。

15.能够感觉到的现象可以比作波浪,是海洋深处我们一无所知的那些乱象在洋面上的表象。

16.昨天受群众拥戴的英雄一旦失败,今天就会受到侮辱。当然名望越高,反应就会越强烈。在这种情况下,群众就会把末路英雄视为自己的同类,为自己曾向一个已不复存在的权威低头哈腰而进行报复。

17.群体在智力上总是低于孤立的个人,但是从感情及其激发的行动这个角度看,群体可以比个人表现得更好或更差,这全看环境如何。一切取决于群体所接受的暗示具有什么性质。

18.群体因为夸大自己的感情,因此它只会被极端感情所打动。希望感动群体的演说家,必须出言不逊,信誓旦旦。夸大其辞、言之凿凿、不断重复、绝对不以说理的方式证明任何事情——这些都是公众集会上的演说家惯用的论说技巧。

19.令人难忘的历史事件,只是人类思想无形的变化造成的有形的后果而已。

20.孤立的个体具有控制自身反应行为的能力,而群体则不具备。

21.专横和偏执是一切类型的群体的共性。

22.影响民众想象力的,并不是事实本身,而是它们发生和引起注意的方式。

23.群体总是对强权俯首帖耳,却很少为仁慈善行感动!在他们看来,仁慈善良只不过是软弱可欺的代名词。

24.大众没有辨别能力,因而无法判断事情的真伪,许多经不起推敲的观点,都能轻而易举的得到普遍赞同!

25.群体盲从意识会淹没个体的理性,个体一旦将自己归入该群体,其原本独立的理性就会被群体的无知疯狂所淹没。

26.从长远看,不断重复的说法会进入我们无意识的自我的深层区域,而我们的行为动机正是在这里形成的。到了一定的时候,我们会忘记谁是那个不断被重复的主张的作者,我们最终会对它深信不移。

27.群体中的个人是沙中之沙,风可以随意搅动他们。

28.群体表现出来的感情不管是好是坏,其突出的特点就是极为简单而夸张。

29.但凡能够成就大业的领袖人物,他重要的品质不是博学多识,而是必须具备强大而持久的意志力,这是一种极为罕见,极为强大的品质,它足以征服一切。

30.文明向来只由少数知识贵族阶级而非群体来创造。

31.身为一位领袖,如果想要让自己创立的宗教或政治信条站住脚,就必须成功地激起群众想入非非的感情。

32.结群后,由于人多势众,个人会产生一种幻觉,感到自己力大无穷,不可战胜,好像没有什么事情是办不到的。

33.当一个人融入社会之中时,他便失去了自我。

34.在迫不得已的情况下,我们也许还是会愿意接受传统教育当中所有的弊端,因为尽管它只会培养一些被社会所抛弃的人、心怀不满的人,但起码,对冗繁知识的肤浅掌握,对成堆教科书的完美背诵,或许可以提高智力水平。但事实上它真的能提高智力吗?不可能!在生活中,判断力、经验、进取心和个性,这些才是取得成功的条件,这些都不是书本所能够给予的。书本是可供查询的有用字典,但倘若把这些冗长的词条都装在脑子里,那可是一点用都没有。

35.文明赖以形成的道德力量失去效力时,它的最终瓦解总是由无意识且野蛮的群体来完成的。

36.一切政治、神学或社会信条,要想在群众中扎根,都必须采取宗教的形式——能够把危险的讨论排除在外的形式。

37.群体精神最需要的不是自由而是服从。他们如此甘愿听从别人的意志,以至于只要有人自称是它们的主人,他们就会本能地听命于他。

38.尽管在那一天的那两个小时里他们做到了或者几乎做到了,到一个月以后他们却不再具备这种能力。他们无法再次通过考试。他们脑中不断丢失大量过于沉重的知识,而且没有新的知识来填充。他们的思想活力开始衰退,促进成长的才能渐渐干涸,这时一个得到充分发展的人诞生了,但此时的他早已疲惫不堪。结婚过上安定的生活,陷入某种循环,并永无止境地重复下去;他将自己封闭在狭隘的工作中,尽职尽责,仅此而已。他们最终变为了平庸之辈。

39.个人一旦融入群体,他的个性便会被湮没,群体的思想便会占据绝对的统治地位,而与此同时,群体的行为也会表现出排斥异议,极端化、情绪化及低智商化等特点。进而对社会产生破坏性的影响。

40.所有时代和所有国家的伟大政客,包括最专横的暴君,也都把群众的想象力视为他们权力的基础,他们从来没有设想过通过与它作对而进行统治。要想掌握这种本领,万万不可求助于智力或推理,也就是说,绝对不可以采用论证的方式。

41.群体的叠加只是愚蠢的叠加,而真正的智慧被愚蠢的洪流淹没。

42.人们经常说起那家大众剧院,它只演令人压抑的戏剧,散场后,必须保护扮演叛徒的演员,免得他遭到观众的暴打。他所犯的罪行,当然是想象出来的,引起了群众的巨大愤怒。我觉得这是群体精神状态最显著的表现之一,这清楚地说明,要给他们什么暗示是一件多么容易的事情。对他们来说,假与真几乎同样奏效。他们明显地表现出真假不分的倾向。

43.各种制度并没有固定的优点,就它们本身而言,它们无所谓好坏。因为在特定的时刻对一个民族有益的制度,对另一个民族也许是极为有害的 。

44.群体也许永远是无意识的,但这种无意识本身,可能就是它力量强大的秘密之一。在自然界,绝对服从本能的生物,其行为会复杂得让我们不敢相信。理智是人类新近才有的东西,太不完美了,不能向我们揭示无意识的规律,更不能替代它。在我们的行为举止中,无意识部分占的比重很大,理智所占的比例却很小。无意识现在仍作为未知的力量在起作用。

45.到了一定的时候我们不会记得那个不断被重复的主张的人是谁,我们最终会对它深信不疑,广告能有令人吃惊的威力,这就是原因 。

46.教育既不会让人更道德,同样不会使他更幸福,它既不能将他的本能改变 ,也不能将他天生的热情改变,而且有在进行不良引导后,它的害处远大于好处。

47.单独一个人必须要为他的行为承担责任——法律上或者道德上。但是,群体则不然,群体不需要承担任何责任,群体就是责任,群体就是道德,群体就是法律,群体就是道德,群体的行为自然是合理的。

48.名望的产生与若干因素有关,而成功永远是其中最重要的一个。

49.学习课程,把一种语法或一篇纲要牢记在心,重复得好,模仿也出色——这实在是一种十分可笑的教育方式,它的每项工作都是一种信仰行为,即默认教师不可能犯错误。这种教育的唯一结果,就是贬低自我,让我们变得无能。

50.民众的想象力是政客的权力基础。

51.在决定人们历史地位上起着更大作用的,不是他们的“真实”面目,而是后人对他们的认识和感受。

52.群体会让每个人在其中的错误缩小,同时让每个人的恶意被无限放大。

54.束缚个人行为的责任感一消失,人便会随心所欲,肆意妄为。

55.群体的无意识行为取代了个体有意识的行为,这是现时代最显著的特征之一。

56.偶像崇拜的五大标识:
第一,偶像总是凌驾于信徒,处于高高在上的地位,这一点有着决定性地作用。
第二,信徒总是盲目服从偶像的命令。
第三,信徒没有能力,也不愿意对偶像规定的信条进行讨论。
第四,信徒有着狂热的愿望,希望把偶像的信条广加传播。
第五,信徒倾向于把不接受它们的任何人视为仇敌。
当群体符合第一条,其形式就等同于宗教,而这种情感就变成了宗教信仰。
对群体来说,也许最不合理的才是最合理的选择

57.群众日益被大众文化所湮没,这种文化把平庸低俗当作最有价值的东西。

58.所以不要轻易地成为集体的一份子,这样很容易被别有用心的人利用,即使你以为自己只不过是随声附和了一下而已,实际上你已经成了帮凶。

59.群体的夸张倾向只作用于感情,对智力不起任何作用。

60.群体不善推理,却又急于行动。
(出处未知)

【第一期】胡言乱语

那年遇一女士,对我照顾有加,用泪磨平我棱角,教我人情世故。纵使他日不能久别重逢,也祝她岁岁平安。
好像什么都来得及,又好像什么都无能为力。

个人主义与合作博弈

灵感来源

从疫情说起——
避免认知偏差,这里定义抗击疫情是需要人们合作博弈的。
假设有一个人很自私,这样的人是否会成为巨大的不稳定传染源。

背景资料

「纳什均衡点」不一定是「全局最优点」。实际上随便一个稍微复杂一点的系统,都不可能达成“纳什均衡”。

拓展阅读——《纳什均衡与博弈论——纳什博弈论及对自然法则的研究》

在博弈中进行合作,未必需要信任。

拓展阅读——《自私的基因》

随想

《纳什均衡与博弈论——纳什博弈论及对自然法则的研究》中提到过一个模型——鹰鸽博弈模型,如果某个鸟群中,每只鸟都采用“鹰策略”,这个种群并不具有“进化稳定策略”;同样的,如果鸟群中每只鸟都采用“鸽策略”,同样具有“进化稳定策略”。只有当两种策略达到某个恰到好处的比例,此时才能形成“进化稳定策略”。
一个社会越多元化,每个个体采用的博弈策略,也会更加多元化。而社会的演化,其实非常类似于生物学中“种群的演化”。博弈策略的多样化,使得整个系统更加能适应环境变化,因此也提升了整个系统的健壮性
《自私的基因》中提到过一个模型,这个模型有三种角色——欺骗者、原谅者、记仇者。两个“记仇者”之间第一次打交道,双方并无信任。但还是可以建立合作关系。

【热点评论】语言的标签化与语言改造

灵感来源

偶然翻阅知乎上的这个回答,恰逢最近在「二刷」《1984》一书。

看到作者举的这些例子,觉得很有趣,果然灵感来源于生活(逼乎)

现在讨论文艺作品是不是很喜欢谈三观。《霍乱时期的爱情》主角是渣男,滥交;《水浒传》是一批没文化的流氓;《雷雨》是狗血故事,多角恋;《洛丽塔》恋童癖,恶心极了;《三个火枪手》讲婚外情;《了不起的盖茨比》主角更是彻头彻尾的渣女……这些文学有什么好看的?还有各种影视剧,有多少良心剧,因为塑造反派的角色过于鲜明,或者一些角色过于现实,被指责“三观不正”。(拿最近来说,余欢水里的妻子角色,因“女拳”问题上了热搜。)

日常生活或者在网络上讨论问题,是不是也很容易以,“女拳”,“杠精”,“小粉红”,“键政”等等给人贴标签?例,“你是杠精,我不和你吵”。然后讨论问题张口闭口,“资本主义”,“理想主义”,“内卷竞争”,“时代红利”……

日常生活,社会评价一个人的行为,家长老师常用的词汇,是不是都是“努力”,“奋斗”,“大城市”,“优秀,“未来会好的”,“xx年纪必须做xx”,“年轻就是奋斗”,“成功”……

作者:苏氨酸·季铵碱
链接:https://www.zhihu.com/question/402959121/answer/1297896811


个人看法

“历史旋转门”
如今的互联网舆论,有很多语言(词汇)的高度标签化,类似于 改革开放之前,中国电影中高度脸谱化的人物形象。这两者的共同点就是过度简化。所谓脸谱化,举个例子——好人就是纯粹的好人,坏人就是纯粹的坏人。
而互联网语境中的标签化,效果也类似。在评价“政治流派”的时候,很多人只知道用“左”和“右”。这就有一个很尴尬的问题——某个人因为某条言论就被“开除左藉”,然后又被扣上“形左实右”的帽子。到底“形左”是指哪些,“实右”又是什么,“说不清”。
为什么说不清呢,因为“左/右”只能表达一个维度的两端,而不同的政治流派,会牵涉到多种维度

成因
思维有两个维度——习惯 & 能力。
有些人有能力,无习惯;
有些人有习惯,无能力;
当然,大部分人两者皆无。
“语言标签化”作为一种“过度简化”的表达形态,也就非常迎合(适合)那些两者皆无的人。
而这类人的比例很大,又反过来助长了“语言标签化”的现象——不了解某种标签的人就无法参与讨论,促使更多人习惯于标签化语言。

区别
上述所讨论的“语言标签化”,同于《1984》中所说的“语言改造”。
两者有某些共同点——两者都倾向于削弱沟通双方的思考。
但“语言改造”对思维的削弱会更彻底。


延伸阅读

一元化归因(fallacy of the single cause)

【第一期】学海对拳——2020.7.11周论文精选

No 1. *《Debiased Contrastive Learning》

技术背景:

Motivation & Framework

很多研究者认为,深度学习的本质就是做两件事情:Representation Learning(表示学习)和 Inductive Bias Learning(归纳偏好学习)。目前的一个趋势就是,学好了样本的表示,在一些不涉及逻辑、推理等的问题上,例如判断句子的情感极性、识别图像中有哪些东西,AI 系统都可以完成非常不错;而涉及到更高层的语义、组合逻辑,则需要设计一些过程来辅助 AI 系统去分解复杂的任务,ICLR 19 的一篇 oral 就是做的类似的事情。因为归纳偏好的设计更多的是 任务相关的,复杂的过程需要非常精心的设计,所以很多工作都开始关注到表示学习上,NLP 最近大火的预训练模型,例如 BERT,就是利用大规模的语料预训练得到文本的好的表示。那么,CV 领域的 BERT 是什么呢?答案已经呼之欲出,就是对比学习。

Illustrative Example
Compare dollar
当你被要求画一张美元,左边是没有钞票在你面前,右边是面前摆着一张钞票画出来的结果

上面这个例子来自于 Contrastive Self-supervised Learning 这篇 Blog,表达的一个核心思想就是:尽管我们已经见过很多次钞票长什么样子,但我们很少能一模一样的画出钞票;虽然我们画不出栩栩如生的钞票,但我们依旧可以轻易地辨别出钞票。基于此,也就意味着表示学习算法并不一定要关注到样本的每一个细节,只要学到的特征能够使其和其他样本区别开来就行,这就是对比学习和对抗生成网络(GAN)的一个主要不同所在。

Contrastive Learning Framework

既然是表示学习,那么我们的核心就是要学习一个映射函数 $f$ ,把样本 $x$ 编码成其表示 $f(x)$ ,对比学习的核心就是使得这个 $f$ 满足下面这个式子:

$$s ( f(x), f(x^+)) >> s ( f(x), f(x^-))$$

这里的 $x^+$ 就是和$x$类似的样本, $x^-$ 就是和$x$不相似的样本, $s(\cdot,\cdot)$ 这是一个度量样本之间相似程度的函数,一个比较典型的 score 函数就是就是向量内积,即优化下面这一期望:

$$\underset{x, x^{+}, x^{-}}{\mathbb{E}}\left[-\log \left(\frac{e^{f(x)^{T} f\left(x^{+}\right)}}{e^{f(x)^{T} f\left(x^{+}\right)}+e^{f(x)^{T} f\left(x^{-}\right)}}\right)\right]$$

如果对于一个 $x$ ,我们有 $1$ 个正例和 $N-1$ 个负例,那么这个 loss 就可以看做是一个 N 分类问题,实际上就是一个交叉熵,而这个函数在对比学习的文章中被称之为 InfoNCE。事实上,最小化这一 loss 能够最大化 $f(x)$ 和 $f(x^+)$ 互信息的下界,让二者的表示更为接近。理解了这个式子其实就理解了整个对比学习的框架,后续研究的核心往往就聚焦于这个式子的两个方面:

如何定义目标函数?最简单的一种就是上面提到的内积函数,另外一中 triplet 的形式就是 $l = max(0, η + s (x, x^+) - s (x, x^-))$ ,直观上理解,就是希望正例 pair 和负例 pair 隔开至少 $η$ 的距离,这一函数同样可以写成另外一种形式,让正例 pair 和负例 pair 采用不同的 $s$ 函数,例如, $s(x, x^+) = \| \max (0, f(x)-f(x^+)\|$ , $s(x, x^+) = \| \max (\eta, f(x)-f(x^-)\|$ 。如何构建正例和负例?针对不同类型数据,例如图像、文本和音频,如何合理的定义哪些样本应该被视作是 $x^+$,哪些该被视作是 $x^-$,;如何增加负例样本的数量,也就是上面式子里的 $N$ ?这个问题是目前很多 paper 关注的一个方向,因为虽然自监督的数据有很多,但是设计出合理的正例和负例 pair,并且尽可能提升 pair 能够 cover 的 semantic relation,才能让得到的表示在 downstream task 表现的更好。

来源:https://zhuanlan.zhihu.com/p/141141365


No 2. 《The Eyes Have It: An Integrated Eye and Face Model for Photorealistic Facial Animation》

No 3. 《Deep Learning-based Computational Pathology Predicts Origins for Cancers of Unknown Primary》
No 4. *《The Art of Natural Language Processing: Classical, Modern and Contemporary Approaches to Text Document Classification :: SSRN》
No 5. *《NVAE: A Deep Hierarchical Variational Autoencoder》
No 6. 《A Survey on Recent Progress in the Theory of Evolutionary Algorithms for Discrete Optimization》
No 7. 《ReXNet: Diminishing Representational Bottleneck on Convolutional Neural Network》
No 8. 《Knowledge Distillation Beyond Model Compression》
No 9. 《LSTM and GPT-2 Synthetic Speech Transfer Learning for Speaker Recognition to Overcome Data Scarcity》
No 10. 《Learning Search Space Partition for Black-box Optimization using Monte Carlo Tree Search》
No 11. 《Transformers are RNNs: Fast Autoregressive Transformers with Linear Attention》
No 12. 具有周期激活函数的隐式神经网络表示
No 13. 《3D Topology Transformation with Generative Adversarial Networks》
No 14. 《Big Self-Supervised Models are Strong Semi-Supervised Learners》
No 15. 《Early-Learning Regularization Prevents Memorization of Noisy Labels》
No 16. 《How benign is benign overfitting?》
No 17. 《The Global Landscape of Neural Networks: An Overview》
No 18. 《Language-agnostic BERT Sentence Embedding》
No 19. *《SurVAE Flows: Surjections to Bridge the Gap between VAEs and Flows》
No 20. *《The Measure of Intelligence》
No 21. 《Validation and generalization of pixel-wise relevance in convolutional neural networks trained for face classification》
No 22. 《The Go Transformer: Natural Language Modeling for Game Play》
No 23. 《Graph Neural Network Based Coarse-Grained Mapping Prediction》
No 24. 《Approximate Nearest Neighbor Negative Contrastive Learning for Dense Text Retrieval》
No 25. 《Wiki-CS: A Wikipedia-Based Benchmark for Graph Neural Networks》
No 26. 《DeeBERT: Dynamic Early Exiting for Accelerating BERT Inference》
No 27. 《Collaborative Learning for Faster StyleGAN Embedding》
No 28. *《In Search of Lost Domain Generalization》
No 29. 《DeeBERT: Dynamic Early Exiting for Accelerating BERT Inference》
No 30. 《Federated Learning with Compression: Unified Analysis and Sharp Guarantees》

来源:爱可可老师 https://www.yuque.com/fly51fly/gvl1ma/esp4c7