人工智能檢析三退數據 700萬中共黨員退黨 (多圖)
 
大紀元記者慧子
 
2006年6月6日發表
 



QSD軟體開發公司在全球退黨服務中心、大紀元退黨網站的授權下,成功地獨家開發了退黨網絡在線實時分析系統最新版本, Quitting CCP Internet Data Real Time Analyzer, Ver1.0, 並於日前首度投入運行,對三退網絡數據進行了授權下的獨立檢索分析。

【人民報消息】自從2004年12月4日首日109人在大紀元網站上公開發表退出中共組織以來,直到本月6月4日爲至,整整18個月(一年半) 550天裏,退黨大潮在中國大陸持續而穩定地波及着中國社會各個層面,也引起了國際社會的密切關注。截止6月4日,據大紀元退黨網站上發佈的退黨退團退隊 (三退)總積累人數超過1090萬。人們一直關心的是,在這趨近1100萬的三退人羣中,有多少真正是中共黨員。

記者今天爲此採訪了位於南加州的 Quality Software Developer (QSD)軟體開發公司。該公司在全球退黨服務中心、大紀元退黨網站的授權下,成功地獨家開發了退黨網絡在線實時分析系統最新版本, Quitting CCP Internet Data Real Time Analyzer, Ver1.0, 並於日前首度投入運行,對三退網絡數據進行了授權下的獨立檢索分析,於昨日正式發出檢索統計分析報告。

該報告表明:通過該網絡分析系統對於 2004年12月4至2006年6月4日期間550天的所有三退聲明數據進行電腦人工智能檢索分析,其結果顯示:在總數爲10,894,981(6月4日下午6時51分美西時間)的三退人數中,有6,589,648人爲中共黨員的退黨人數,佔總三退人數的60.5%。由於尚有1078693人次的聲明因爲中文表達的複雜特點令電腦分析系統不能確切判定,考量此100萬未確定的三退人羣中尚含有一定數量的黨員退黨數字,故60.5%的退黨百分比爲最低保守數字,而實際的退黨人數可能超出660萬這個保守退黨人數,大概至少有700萬中共黨員在過去的一年半中退出了中共組織。




2004年12月4至2006年6月4日期間,退黨、團、隊人數分別佔總三退人數的60.5%、16.3%、13.3%。

該網絡分析系統具有高速人工智能漢語分析能力,具備對數以千萬計的三退網絡資訊進行準確快捷的檢索、分類和統計功能,旨在對數量龐大並繼續快速增加的網上三退聲明的文字資訊進行分類檢索,以期滿足海內外各界人士一直對三退人數中實際中共黨員人數的真實分佈情況的迫切關注;同時可以幫助海內外政治經濟文化等各個階層人士對於中國大陸出現的三退大潮的實際狀況、未來趨勢、對於國內事態及國際社會的影響等方面作出客觀的和科學的評價和判斷;也同時對於中共內部尚未退出相關組織的人士及時作出正確的選擇提供參考資訊。

記者採訪該公司軟體開發負責人劉博士,他介紹了他們首度運行該分析系統的情況和目前得知的最新數據。記者親自看到初次投入運行的快速網絡分析系統的實際運行情況,並對屏幕上的在線報告數據感到極大的興趣。劉博士在記者建議下獲得該網絡分析系統在本報告截止時間的屏幕快照畫面,上面的報告數據成爲過去一年半期間中國大陸實際黨員退黨人數的首次數字證據之一。




2004年12月4至2006年6月4日期間,退黨、團、隊人數分別佔總三退人數的60.5%、16.3%、13.3%。

當記者問到,如何對三退聲明的文字進行檢索分析並確保其結果的準確性時,劉博士對於他們軟件設計的一些基本原則性構思和程序化過程做出了如下解釋。他說: 「人類語言(包括人類的文字語言),與電腦語言有着很大不同,它並不是一種確定的線性形式的信息,尤其是中文的表達方式多樣而複雜,這對於開發分析中文語言文字的電腦軟體來說,在技術上提出了一個一定程度的難題。」

「對於三退聲明的文字分析這一特定目的的軟體,我們首先採取人工的方法閱讀大量的三退聲明的文字數據,對於人們各種可能的表達方式、語法結構、用詞特點、標點使用、以及人們的語言心理過程等進行分析和分類。然後針對這些儘可能的語言模式設計出電腦分析用的各種過濾器。當文字信息經過這些過濾器時,它們將被自動篩選分類。過濾器即是一些關鍵詞的前後不同組合。比如:」

「退黨、退出共產黨、退出邪惡共產黨、退出邪黨、退出惡黨、退出中共、退出早年加入的共產黨、我曾加入過共產黨,現在退出、我是中共黨員,現在聲明退出,等等等等,許許多多的可能說法,更加對相關詞的先後搭配來分析其說話人的意思。以上這些說法都可分爲退黨類中。」

「也有許多聲明有退黨、團、隊在同一個短句或段落中出現。這時必須對整個聲明進行讀寫和分析,從而做出正確判斷。凡是聲明人同時聲明退黨、退團、退隊的,就分爲退黨類;凡是聲明人同時聲明退團、退隊的,就分爲退團類;當然只是聲明退隊的那麼就是退隊類。句子中退黨、團、隊的順序可能各有不同,但根據其所退最高組織爲準而分類。」

「對於同一聲明中多人聲明退黨團隊的,需要逐字分析哪些人屬於退黨,哪些人是退團或者退隊的。有時聲明人寫的清楚,如退黨人:XXX,XXX,XXX,列出人名。那麼我們的軟體可以清點人數而將其歸入退黨類。人名可能以逗號分開,也可能以頓號、甚至個別的也有用其他標點分開的。有時是中文的標點,也有時是英文的標點,這都要加以區分方可準確無誤地數清人數。在人名前的引導詞,也可能是各種說法,比如:「退黨聲明人:」「退黨團隊人:」「退黨、團、隊人:」「退黨,團,隊人:」「退黨退團退隊人:」等等,許多可能都要考量進去。這裏就不去一一列舉了。總之,我們的軟件工程師竭力將各種中文的語言表達方式「教」給電腦,讓它掌握識別分析此類中文語句的能力。」




2004年12月4至2006年6月4日期間,退黨、團、隊人數的逐月分佈曲線。退黨曲線上升的月平均斜率爲12040/月。

劉博士最後告訴記者說:「我們在開發上述網絡數據分析系統的過程中,因爲閱讀大量退黨聲明的內容而受到極大的鼓舞,不僅看到了中國大陸退黨現象的真實性,也被那些中共內部醒悟後同胞那種毅然決然又刻不容緩退出的迫切心情所感動,深深感到中國大陸出現的退黨大潮是一件歷史意義重大的民族精神覺醒運動,一個有着五千年中華民族傳統道德基礎的民族開始在從近一個世紀外來邪靈控制中甦醒過來,這非常令人欣慰。」

「過去整整550天的退黨大潮中,我們的網絡系統對每一天每一個記錄進行逐字分析,我們的面前掠過一個個以日期、時間分秒、人名、地區、聲明人數、聲明全文爲記錄項目的真實文字數據,有的是一個人退黨,有的是成羣結隊數百人集體退黨,就是受到這些人們的精神力量的鼓舞,我們一次次不倦地修改和完善着我們的軟體,最終得以順利完成。」

「我們對我們的產品及其分析結果的準確度具有足夠的信心,我們曾經對現有分析結果,通過部分人工閱讀分類的方法加以評估,結果與我們的電腦軟體分析結果相吻合。希望我們的分析數據對於各界人士提供有價值的參考。我們還將繼續努力,對於那些尚未確定分類的佔總三退人數9.9%的100萬三退聲明進行更高一級的分析檢索。我們在升級我們的版本,設計一種更爲合理準確的檢索系統,降低誤差和不確定分類的比例。」




過去一年半期間550天逐日退黨、團、隊的分佈曲線。退黨數據分佈具有總三退數據的分佈特徵,代表了三退的主體。

最後劉博士用一段來自中國大陸的退黨聲明與我們的讀者分享:

「在共產黨的紅色宣傳和矇騙中,我帶着個人目的入了黨。自從入黨後,我深感痛悔,因爲我越來越認識到共產黨是一個說謊的黨,是一個整人的黨,是一個假話說盡壞事做絕的黨。近幾年來,我更感到它是一個禍國殃民的邪靈,它的實質--不僅狡詐、尖滑、墮落腐敗,而且發展爲好壞不分,正邪不分,善惡不分,黑白顛倒。它兇惡、殘暴,流氓手段,比黑社會更邪。爲此,我特聲明從今以後退出共產黨,不再參加其組織的任何活動,以前的入黨宣誓我宣佈作廢。」

(圖片來源 : 大紀元)

 
分享:
 
人氣:107,329
 

如果您喜歡本文章,歡迎給予打賞。讓我們一起打拼未來!
 
       

 
 

 
 
人民報網站服務條款
 
反饋信箱:[email protected]