張朋朋丨從文字的產生到ChatGPT的出現
提要:本文認爲,文字是人類創造的用字形表達和記錄思想的工具。文字比語言重要,因爲不是語言,而是文字的產生才令人類社會發生了重大變化。ChatGPT是具有人工智能的文字工具。文字工具經歷了在紙上書寫的傳統階段、計算機和互聯網階段,將要進入人工智能階段。從文字的產生到ChatGPT的出現證明:文字不是語言,而是人造的工具,文字工具比自然語言重要。本文質疑:為什麽西方只有語言學,沒有文字學?西方語言學的文字觀是正確的嗎?我們中國引進了西方語言學,我們中國該怎麽辦?關鍵詞:文字工具 ChatGPT 人工智能 西方語言學 文字觀人在語言環境中自然可以獲得聽説語言的能力。自然語言用口發出,由耳接收,由聽覺感知,是用語音表達思想的。古人用自然語言只能近距離交换,而且語言一發即逝,不能保存,人用自然語言與人交换遭到時間和空間的限制。爲了把語言表達的思想能讓遠方的人和後人知道,人類根據語言創造出了用手發出,由眼接收,由視覺感知,可超出時空的,用字形表達和記錄思想的工具。文字這種工具是由表示意義的字形、存留和傳輸字形的載體和呈現字形的方式三部份構成的。人使用文字這種工具的能力要通過教學才能獲得。語言和文字是人類使用的兩種区别的表達思想的方式,語言用語音,文字用字形。因爲表示意義的字形是人根據用語音表示意義的語言創造的,所以字形與語音是有聯係的,是逐一對應的。人使用文字這種工具的能力要通過教學才能獲得。通過文字教學,表示意義的語音和表示意義的字形在人腦中建立了聯繫,學過文字的人看到字形可以讀出語音,也能够聽到語音寫出字形,也就是說,語音和字形可以相互轉化,但字形不是語音,因此,書寫的字形不是語言,文字不是記錄語言的,而是用字形表達和記錄意義的工具。見下圖:人類只有語言的歷史長達幾十萬年,但發展緩慢,而有文字的歷史短短幾千年,但人類社會的發展突飛猛進,生活和生產方式發生了天翻地覆的變化。這是為什麽?因爲有了文字這種工具,人的思想和智慧可以記載和存留了,可以代代傳承和廣為傳播了,突破了時間和空間的限制。其實,人類是一個相當脆弱的物種,跑不過馬,鬥不過熊,嗅覺不如狗,視覺不如鷹,能從衆多高等動物中脫穎而出的缘由就是因爲人類發明了文字這一工具。從此,人類的知識可以積纍、傳承和廣爲傳播了。人通過實踐可以產生對世界的認識並獲得一定的改造世界的能力,但如果沒有文字,就僅存於個體的人腦中,會隨著個體的死亡而消失,無法積纍和傳承,而有了文字,人可以將個體所獲得的知識存儲在體外,买通了整個物種的過去和未來。也就是說,有了文字,一個人的肉體死了,但他的靈魂可以不死,他的思想和智慧可以轉化成字形存留在體外的載體上被整個人類所享用,令人類越來越有智慧。文字產生早期,文字的功能並不強大,在人類發明了造紙術和印刷術後,存留和傳輸字形的載體和呈現字形的方式發生了革命性的變化。文字的功能強大了,書籍大量產生,出現了藏書樓和圖書館。人類的思想文化和科技知識不斷積累和廣泛傳播,推動了教育的普及和學科的建立。有了文字,才有書籍,有了書籍,才有教育,有了教育的普及才有越來越多的讀書人,具有文字能力的讀書人越多,科學技術才越先進,社會才越文明。造紙術和印刷術的出現證明:文字不是語言,而是人造的工具,文字比語言重要,因爲不是語言,而是文字的產生才令人類社會發生了重大變化。隨著科學技術的發展,人類發明了計算機和互聯網,呈現字形的方式和存留、傳輸字形的載體又發生了革命性變化。文字工具進入了計算機和互聯網時代。文字數字化,紙質書和文件變為電子書和電子文件,人們閲讀、寫作和通訊更為便利了,獲取知識、學習知識、創造知識和傳播知識的能力也提高了,生活和生產方式也發生了重大變化。計算機和互聯網的出現再次證明:文字不是語言,而是人造的工具,文字比語言重要,因爲不是語言,而是新的文字工具的出現才令人類社會發生了重大變化。隨著知識的爆炸式增長和國際化傳播和各行各業每天都在產生大量的電子文件,閲讀和寫作和翻譯和傳輸的文件數量和複雜程度是空前的。爲了解決這一難題,ChatGPT應運而生。美國公司發佈的ChatGPT是用海量的文字數據研製的一種具有生成式人工智能的文字工具,是一個由人訓練的具有很強的閲讀和寫作能力的機器人。ChatGPT是具有人工智能的文字工具。文字工具經歷了在紙上書寫的傳統階段、計算機和互聯網階段,將要進入人工智能階段。從文字的產生到ChatGPT的出現證明:文字不是語言,而是人造的工具,文字工具比自然語言重要。因爲不是自然語言,而是文字工具的不斷改進令人類社會發生了重大變化。問題是:文字工具如此重要,為什麽西方只有語言學,沒有文字學?為什麽西方只研究語言,不研究文字?爲什麽ChatGPT這種工具不是西方語言學家研究出來的?為什麽著名語言學家喬姆斯基認爲ChatGPT是高科技剽竊?他為什麽認識不到ChatGPT的重要性?西方語言學認爲,文字是記錄語言的書寫符號,文字是書面語言。西方語言學通過文字來認識語言,認爲文字表現(代表)語言。也就是說,西方語言學認爲,文字是語言,文字表現語言,所以西方只有語言學,沒有文字學,只研究語言,不研究文字。西方語言學的文字觀是西方語言學家對拉丁字母文字的看法。顯然,漢字不是漢語,因爲漢語不是一種語言,而是多種方言的總稱。西方現代語言學之父索緒爾也發現西方語言學的文字觀不適用于中國的漢字,他明確聲明“我們的研究將僅限於表音體系的文字”。本人質疑的是:西方拉丁字母文字是語言嗎?西方拉丁字母文字表現語言嗎?西方拉丁字母文字的字形表現語音嗎?有表音文字嗎?西方語言學的文字觀正確嗎?本人認爲,西方拉丁字母文字也不是語言。西方人之所以認爲拉丁字母文字是語言,是因爲他們把拉丁字母文字的字形當成語音了。其實,拉丁字母文字的字形不是語音,只是人們看到字形可以讀出語音,這是字形和語音通過人腦進行轉化的現象,但不能因爲語言和文字可以相互轉化,就把两者混爲一談,就認爲文字也是語言。西方拉丁字母文字的字形不可能表現無形的語音。根本就沒有表音文字。西方拉丁字母文字的字形也是表示意義的。西方拉丁字母文字也是人類創造的用字形表達和記錄思想的工具。拉丁字母文字的字形也是可以用筆在紙上書寫的,這種文字工具也經歷了傳統的書寫、打字和印刷階段、計算機和互聯網階段,現在將進入人工智能階段。ChatGPT是具有人工智能的文字工具。ChatGPT的出現又一次證明:文字不是語言,而是人造的工具。本人認爲,西方語言學的文字觀是錯誤的,文字不是語言,應該區分語言和文字。因爲語言和文字不屬於同一類事物,語言具有自然屬性,語言是自然產生的,人的語言能力也是自然獲得的,而文字具有人造屬性,文字是人造的工具,人使用這種工具的能力要通過教學才能獲得。只有語言的社會是愚昧、落後的,有文字的社會是文明、先進的,只有語言能力的人是正常人,是文盲,有文字能力的人是讀書人,是文化人。只有區分語言和文字的人材能認識到:文字比語言重要。美國語言學家喬姆斯基就是因爲不區分語言和文字,所以他認識不到ChatGPT的重要性。可見,區分語言和文字是非常必要的。西方只有語言學,那為什麽ChatGPT這種文字工具會在美國出現呢?因爲文字是人造的工具,是客觀存在的,只是西方語言學家沒認識到。西方人不僅使用文字工具,而且也不斷改進文字工具。因爲改進呈現字形的方式和存留、傳輸字形的載體需要機械工程和電子信息工程方面的知識,所以打字機、印刷機、計算機和互聯網等新的文字工具都是由機械工程師和電子信息工程師研發出來的,而美國在電子信息科學方面是處於世界領先地位的。本人認爲,語言和文字不屬於同一類事物,語言是自然之物,文字是人造之物。人類應建立語言學和文字學兩門學科,語言學研究人類的自然語言,研究人的語言能力是如何自然獲得的。文字學研究人造的文字工具,研究人的文字能力是如何通過教學獲得的。因爲我們中國引進了西方語言學,也就是說,從西方引進了一門錯誤的學説。我們中國古代有文字學,沒有語言學,中國古人對文字的出現用“天雨粟,鬼夜哭”來形容,可見,中國人認爲文字的出現是件驚天地,泣鬼神的大事,文字的出現會令人類發生天翻地覆的變化。因此,中國人重視研究文字。許慎的《説文解字》是文字學著作。許慎不認爲文字是語言,他認爲:“蓋文字者,經藝之本,王政之始,前人所以垂後,後人所以識古。”許慎對文字的認識是正確的。中國古人不斷改進文字工具,造紙術和印刷術就是中國人因使用漢字而發明的。有了造紙術和印刷術,中國是當時世界上書籍最多的國家。中國人重視讀書和讀書人,認爲“萬般皆下品,惟有讀書高”。中國有豐厚的文化典籍,有悠久的漢字教育史。中國古代教經典古文,白話文出現後,古人繼續教經典古文,古人覺得這個傳統沒必要改,因為白話文不用教,凡是讀古文的人都具有讀寫“文言文”和“白話文”兩種能力,可一舉兩得。也就是說,我國古代教經典古文的傳統是自然构成的,符合漢字教學的規律。千百年來,中國改朝換代,但教育傳統一直沒有變,才使得中國文化代代相傳,沒有中斷,但今天中斷了。因爲中國引進了西方語言學。根據西方語言學的文字理論,中國進行了文字改革和文字教育改革。中國語言學家認爲“代表語言,也就是能讀出來,這是文字的本質”,於是他們要把漢字改成容易讀出來的拉丁字母文字。中國語言學家提出了文字改革的三大任務:推廣普通話、推行漢語拼音方案、簡化漢字。根據“文字是記錄語言的書寫符號”的理論,中國語言學家認爲,古文是古代漢語,白話文是現代漢語。這樣,有人提出的“廢文言,興白話”就有了語言學的理論依據,於是中國基礎教育就由教“經典古文”改教“白話文”了。這樣,中國語言學家根據西方語言學的文字觀就改變了中國千百年來所构成的教育傳統。中國的文字改革和文字教育改革的後果是:漢字險些遭受滅頂之災,中國出現了文化斷層,今天大多數中國人幾乎喪失了獲取古人智慧的能力,成了半文盲和文化盲。可以說,全球受西方語言學危害最大的國家就是我們中國。我們中國該怎麽辦?本人認爲,一是要糾正錯誤,二是要研發漢字的ChatGPT。糾正錯誤更重要,因爲如果大多數中國人是半文盲和文化盲的話,中國是沒有前程的。說起來,改變中國人半文盲和文化盲的狀況並不難,不需要摸著石頭過河,只需要恢復使用繁體字和恢復文字教育的傳統就好了。過幾十年,像梁啓超、陳寅恪、魯迅、胡適、陳獨秀一樣的,既通文言,又會白話,具有全面和高水平的漢字能力的中國人就會大量出現。而實際上,糾正錯誤非常難。因爲要糾正錯誤,就要否定西方語言學的文字觀。按理説,我們中國人否定西方語言學的文字觀比西方人容易,因爲我們中國用的不是拉丁字母文字,而是漢字,連西方著名語言學家都聲明他們的文字觀是不適用于漢字的。而實際上:中國語言學家更難否定西方語言學的文字觀。法國著名哲學家德里達在他的《論文字學》中否定了西方語言學的文字觀,提出要建立文字學。英國牛津大學教授羅伊哈里斯也著書《反思文字》,提出“文字比語言重要”,但在我們中國,卻鮮見有中國的學者站出來否定西方語言學的文字觀,這是為什麽呢?希望大家思考。我只知道,西方語言學占領了中國的學術陣地和教育陣地。這兩個陣地不換人和不換理論的話,文字改革和文字教育改革的錯誤是不可能糾正的。再談研發漢字的ChatGPT。計算機出現後,有人說“計算機是漢字的掘墓人”,但我們讓漢字進入了計算機,實現了用電腦打字和漢字數字化。互聯網出現後,我們也實現了漢字網絡化。ChatGPT可以閲讀和寫作,是具有生成式人工智能的文字工具,這種文字工具是靠文字數據訓練出來的,因此,研發漢字的ChatGPT的關鍵是使用什麽樣的漢字數據,也就是說,研究人員面臨兩種字體(簡體字和繁體字)和兩種文體(文言和白話)的問題。我們國家的《通用語言文字法》規定:國家的通用語言和文字是普通話和規範漢字,也就是說,是白話文和簡化漢字。因此,研發漢字的ChatGPT,研究人員首先要面臨使用什麽字體和文體的問題。國家通用語言文字法是根據西方語言學理論制定的,今天該不該修改?我認爲,該修改,不修改的話,不利於中國研發漢字的ChatGPT,不利於中國進入人工智能時代。天地生人講座丨張朋朋:從文字的產生到ChatGPT的出現(一)天地生人講座丨張朋朋:從文字的產生到ChatGPT的出現(二)作者:張朋朋,北京語言大學教授,曾在巴黎東方語言學院、瑞士日內瓦大學、英國倫敦大學和美國耶魯大學等國外多所大學任教或講學。著述:《文字論》《集中識字》《部首三字經》《漢語語言文字啟蒙》又名《字啟蒙》(與法國白樂桑先生合著)
X
截屏,微信识别二维码
微信号:muhuanidc
(点击微信号复制,添加好友)
打开微信
微信号已复制,请打开微信添加咨询详情!