“從此,我們多了個天眼般的閱讀者”

“用數字史學的方式去研究歷史,人的價值或者個性怎么辦?”

發自:上海、廣州

責任編輯:劉悠翔

《收獲》雜志復刊四十年來刊載的小說中,第一個十年最突出的高頻詞是“我要”。從第二個十年開始,高頻詞變成“我們”“他們”“自己”。文學創作也逐漸恢復到對日常生活的關注和書寫。 (受訪者供圖/圖)

(本文首發于2019年12月19日《南方周末》)

“計算機不理解任何人類語言,但是它有兩個好處,第一很快,第二很穩定。你讓我看兩千萬字的小說,我看到后面就完全忘記前面?!?/p>

“用數字史學的方式去研究歷史,人的價值或者個性怎么辦?”

戰玉冰用12.5小時“讀”完了749部中國網絡小說,總字數七億兩千九百多萬字。即便按一天一部的速度閱讀,普通人要用兩年多時間才能讀完。戰玉冰只用了半天時間,因為他借助了一款大數據軟件。

軟件是上海作家走走開發的。2017年,走走辭去《收獲》雜志社的編輯職務,與鄭翔宇聯合創業,新業務主要是為影視公司評估文學作品。當時,影視公司熱衷于購買網絡文學的作品版權。這些作品動輒幾百萬字,走走讀完一部就需要一周。這也是行業內普遍的煩惱。走走暢想,如果有一個工具,能幫大家迅速看完小說,告訴大家情節是什么就好了。大數據軟件的雛形誕生了。

軟件研發不久,影視行業遭遇寒冬,走走和鄭翔宇的公司業務短缺,面臨轉型。2019年,《收獲》雜志復刊四十周年,雜志社得知走走的軟件,想用這款軟件做一個報告,分析過去四十年《收獲》刊載小說的風格變化。走走的軟件從此邁向人文學科。

報告由復旦大學博士生戰玉冰撰寫。戰玉冰的專業是中國現當代文學,學者們研究時也會用到統計,比如魯迅《狂人日記》里寫到了多少次“狂人”、多少次“吃人”?!巴ㄟ^統計數據來樹立小說的主題,這樣的研究很多?!睉鹩癖牟┦空撐男杞y計民國時期偵探小說發表情況,他用了半年時間,才統計完這項龐大的數據?!妒斋@》四十年刊載的小說也是龐大的數據,借助軟件,戰玉冰只用兩周就拿到了想要的數據。

數字文學只是“數字人文”的眾多分支之一,其他分支包括數字史學、數字哲學、數字藝術等等。據南京大學藝術學院副教授陳靜研究,中國學界2009年才開始廣泛關注數字人文。這一年,武漢大學王曉光教授發表科普文章《“數字人文”的產生、發展與前沿》,在“科學網”上獲得上萬在線點擊。2011年,中國首家數字人文研究中心落戶武漢大學。

“數字人文不僅是量化的方式或者統計的方式

登錄后獲取更多權限

立即登錄

網絡編輯:柯珂

歡迎分享、點贊與留言。本作品的版權為南方周末或相關著作權人所有,任何第三方未經授權,不得轉載,否則即為侵權。

{{ isview_popup.firstLine }}{{ isview_popup.highlight }}

{{ isview_popup.secondLine }}

{{ isview_popup.buttonText }}
午夜宅男在线,中视在线直播,毛片网站在线,福利在线网址