我是一个比较随性的人,但长这么大,有一个原则却是我一直坚守的:不打女人。在最严峻的时候,这个原则也不曾逾越。小学四年级,我被同桌女生欺负,她用铅笔往我手臂上戳,抄我的作业,然后把我的作业扔掉,同时天天骂我,我在最生气的时候真的想豁出去大打一架,但还是忍住了,我从不后悔我的决定。

家庭暴力对我而言是一个遥远的概念,我的父母经常吵的很凶,但是我不曾亲眼看到过家庭暴力。随着年龄的长大,身边的人和周围的世界慢慢变得难以捉摸起来,家庭暴力从电视电影变成了谈资和亲历。

前不久和菜头发布了一篇「女生嫁到哪个省最安全」:根据离婚判决文书的地区分布和人口基数,算出每10万人中,有多少起因家暴造成的离婚(见下图),我认为这个想法非常有价值,但是结论却并不客观,因为仅仅通过数量做决策,就忽略了没有提起离婚诉讼的人群,这部分人可能是家暴更大的受害者,例如家暴指数最低的西藏,完全可能是因为西藏的民俗使得人们并不倾向于拿起法律来解决家庭问题。因此,单纯的地域分布并不严谨,而且很有可能被小部分人拿来作为地域歧视的武器。

我觉得,对于法律判决的挖掘可以做的更深入,更抽象一些。为此,我打算写一个爬虫,自己把这些判决文书(通过中国裁判文书网)爬下来做一些分析。

这个世界真是很不友好,一开始我按照以往的思路写爬虫,但是没爬几篇,IP就被封了,于是我买了最贵的代理,优化了爬取策略,这才把数据爬下来(9458份)

数据爬下来之后,我做了大量的结构化工作:通过正则匹配,我把一篇判决书分成三个部分:原告说的,被告说的,法院说的,并且我把法院引用的法律条文单独存了下来,这样一来,后面的分析就可以更有针对性了

首先,根据对原告被告谁是施虐者,谁是受害者的判断,我发现,并不是所有的原告都是受害者,多达9.32%的被告才是家庭暴力的受害者:

打人的反而把被打的告上法庭,这是为什么呢?我阅读了一下信息,发现这其中很多都是由于被打的不堪忍受,最后奋起反击,或者直接杀掉了施暴者。这样的案例有不少。虽然我并不支持这样的行为,但是我不得不说一句,先不谈道德法制,家暴也有很大的惹上杀身之祸的风险的。

在原告和被告的供词中,我用匹配关键词的方式来分析他们是否有孩子,结果出乎我的意料:

居然大部分离婚官司的对象都有孩子,后来我也想到了缘故,如果没有孩子,很可能就直接协议离婚了,并不会闹到法庭上来,孩子是很多婚姻的维系,但也是一旦离婚,双方都会拼命争取的对象。值得一提的是,这些家暴且有孩子的家庭中,有女儿的比有儿子的略多,这个现象值得我们思考。

裁判文书很有意思的一点是,会记录很多细节,例如很多文书中都记录了现在闹离婚的两人是如何认识的,大致上分为「经人介绍」「通过网上」「相亲」和「婚恋交友网站」,这几者的比例如下:

数据打破了「熟人介绍更靠谱」的认知,事实上,「网上认识」居然是家暴导致离婚的案例中占比最小的(可能存在偏差,约40%没有写明是如何认识的)

事情的发生一般都有某些原因,通过自然语言处理和正则匹配,我找到了这些案例中「家庭暴力」的发生原因:

赌博,经济问题和酗酒往往伴随着家庭暴力,但绝大部分家庭暴力的导火索是「生活琐事」,或许这几个字背后有着太多不足为外人道的隐秘与辛酸,但无论如何,我丝毫不认为施暴者情有可原,所有人都会遇到家庭琐事,正所谓家家有本难念的经,但是把这些问题诉诸暴力,伤害别人的人身安全,这是不应该被谅解,也没有任何借口的。

我还注意到一个令人心寒的事实,13.39%的家庭暴力受害者选择过多次报警求助,但最终离婚判决往往都在1-2年后才能下来,这期间会经历什么,只有老天才知道。

我把这些判决中法庭引用的主要法律做了一个统计,结果如下:

图片被挤的太小,相关排名前五的依次为:

  • 《中华人民共和国婚姻法》第三十二条:1883
  • 《中华人民共和国婚姻法》第三十七条:517
  • 《中华人民共和国婚姻法》第三十九条:423
  • 《中华人民共和国婚姻法》第三十六条:413
  • 《中华人民共和国婚姻法》第四十六条:331

任何人结婚前,都可以好好看看这些法律条文。

我花了很长时间,试图找到一个画像方法:什么样的人,最有可能是一个家庭暴力的施暴者,但是我没有什么成果,具体的事件千差万别,人也是不一样的。但我唯一确定的是,家庭暴力并不存在「改过」的概念,这几千份案例都是血淋淋的教训。我个人认为,家庭暴力比出轨更可恶,出轨是不尊重这段关系,而家庭暴力则是不尊重对方作为一个人的基本权利。因此,对家庭暴力应该零容忍,并且,应该学会拿起法律的武器来保护自己。

最后,放出我从原告的供词和被告的供词中抽取出来的词云,大家可以看看~


我的微信公众号~