您的位置: 首頁 > 新聞中心
新聞出版從業者的福音!方正智能輔助審校系統來啦
發布時間: 2019/12/30 17:45:48

1.jpg

隨著知(zhi)識更新(xin)的(de)速度(du)越來越快,信息發布、知(zhi)識傳播的(de)時(shi)效(xiao)性(xing)要求(qiu)越來越高,新(xin)聞出版從業人員編(bian)輯加工文字的(de)工作量(liang)越來越大(da),編(bian)校質(zhi)量(liang)面臨的(de)挑戰也越來越多。與此同時(shi),人工智能技(ji)(ji)術(shu)(shu)、自然語言理解技(ji)(ji)術(shu)(shu)、機器深度(du)學(xue)習技(ji)(ji)術(shu)(shu)的(de)發展(zhan),為內容質(zhi)量(liang)把關和提(ti)升提(ti)供了新(xin)的(de)解決辦法。


12月30日,方(fang)(fang)正(zheng)電(dian)子(zi)正(zheng)式發布方(fang)(fang)正(zheng)智能輔助審(shen)(shen)校系統V1.0。這(zhe)是(shi)方(fang)(fang)正(zheng)電(dian)子(zi)聯合(he)數字出(chu)版技術(shu)國(guo)家重點實驗(yan)室、高等(deng)(deng)院校、行(xing)業專家等(deng)(deng)一起進(jin)行(xing)技術(shu)研究和攻關的成果(guo),也是(shi)在眾多新聞出(chu)版單位的積極參與(yu)和應(ying)用檢驗(yan)下,經過不斷迭(die)代更(geng)新的產品,在字詞審(shen)(shen)校、知識審(shen)(shen)校、格(ge)式審(shen)(shen)校、邏輯審(shen)(shen)校方(fang)(fang)面(mian)都取得了實質性的進(jin)展(zhan)。

2.gif

▲方(fang)正智能輔(fu)助審校產品(pin)功(gong)能介紹

系統簡介

方正智能輔助(zhu)審(shen)校立足新聞出版(ban)行業,并逐漸向整個文(wen)化傳媒領域(yu)延伸,為出版(ban)社、報(bao)刊社、民營書商、排版(ban)公(gong)司(si)、互聯網企業、政(zheng)府機關等機構用(yong)戶以及作(zuo)者、工作(zuo)室等個人用(yong)戶提供強大且易用(yong)的智能輔助(zhu)審(shen)校服務。

該(gai)系統是專門為新聞出版機構提供數字化內(nei)容輔助(zhu)審校的工具,能夠對內(nei)容進行多方面檢(jian)校,包(bao)括(kuo):字詞(ci)檢(jian)查(cha)、標點符號檢(jian)查(cha)、文(wen)(wen)章邏輯檢(jian)查(cha)、上下文(wen)(wen)查(cha)重、專業(ye)術語檢(jian)查(cha)、敏感詞(ci)檢(jian)查(cha)等。

該系統(tong)提供兩種產品(pin)形態的(de)服(fu)務,支(zhi)持(chi)對Word稿件和標準(zhun)PDF稿件進(jin)行內容審校,滿(man)足(zu)不同(tong)人(ren)員角色、不同(tong)工作場景的(de)使用需求(qiu)。

01.Word客戶端插件

3.jpg

▲產品(pin)形態之一:Word客戶端插件

02.云端在線審校平臺

4.jpg

▲產(chan)品(pin)形態之二:云端(duan)在線審校平(ping)臺

功能介紹

方正(zheng)智能輔助審(shen)校通過(guo)語(yu)言模(mo)(mo)型和機器深度學習技術,通過(guo)構建算法模(mo)(mo)型對(dui)海量真實語(yu)料不斷訓練及(ji)優化(hua),累(lei)積的錯詞、專業術語(yu)、敏感詞、慎用(yong)詞、異形詞等類型的編校知識(shi)詞條超過(guo)百萬。

方正智能(neng)輔助(zhu)審(shen)校(xiao)系統(tong)參考并(bing)依(yi)據《作者(zhe)(zhe)編(bian)輯(ji)常用(yong)標準(zhun)及規(gui)范(fan)(fan)》(第三版)《標點符號用(yong)法 GBT 15834-2011》以(yi)及《圖(tu)書編(bian)輯(ji)校(xiao)對實用(yong)手冊》《通用(yong)規(gui)范(fan)(fan)漢(han)字(zi)表2013版》等標準(zhun)規(gui)范(fan)(fan)或權(quan)威資料(liao),將(jiang)模型、語料(liao)、規(gui)則三者(zhe)(zhe)相結合,研(yan)發(fa)出邏輯(ji)類(lei)(lei)、字(zi)詞類(lei)(lei)、知(zhi)識(shi)類(lei)(lei)、格式類(lei)(lei)四(si)類(lei)(lei)審(shen)校(xiao)功能(neng)。

通過(guo)方正智能輔助(zhu)審校系統,使(shi)用者不僅(jin)能夠(gou)對稿(gao)件中(zhong)的錯詞錯字、敏感詞、相(xiang)似內容、公元紀年(nian)、歷(li)史紀年(nian)、干支紀年(nian)、標(biao)點符號(hao)進(jin)行檢(jian)查,還(huan)可以對稿(gao)件的大(da)綱標(biao)題、圖表公式(shi)列表的序號(hao)等進(jin)行檢(jian)查,對于(yu)識(shi)別(bie)出的錯誤還(huan)可以給出修(xiu)改建(jian)議(yi),并且(qie)支持對錯誤進(jin)行快速定位、導出及修(xiu)改。具體功能介紹如下(xia):

錯詞錯字檢查

檢查稿件中是否存(cun)在(zai)錯(cuo)字、別字、疊(die)字、疊(die)詞(ci),以(yi)及“的地得(de)”類錯(cuo)誤。

5.jpg

▲圖中:“因(yin)些該尺(chi)度(du)具有﹥和(he)﹤的(de)數(shu)學特性”,“因(yin)些”需改為(wei)“因(yin)此”

敏感詞檢查

敏感(gan)詞(ci)檢查包括國(guo)家主權和領土完整(zheng)、港澳(ao)臺問題(ti)、民族宗教問題(ti)、國(guo)際關系等(deng)敏感(gan)內容檢查。

6.jpg

▲不得稱為“全國人大副委員長(chang)”

▲“珠穆朗(lang)瑪峰”不得稱為“額菲爾士峰”

▲“從香港征集(ji)回國”,有(you)將香港視(shi)為國家(jia)的嫌疑

▲“回族(zu)就(jiu)是伊(yi)斯蘭教(jiao)”將民族(zu)和宗教(jiao)混為一談

▲“錫金(jin)是中(zhong)國的鄰國”,2005年5月起(qi),不得(de)將錫金(jin)作為獨立國家提及

▲對有身體傷疾的人士不使用“獨眼龍”等蔑稱

標點檢查

檢查(cha)稿件中是否存在(zai)成對標點符(fu)號(hao)缺失(shi)或格式不一致,以及不同標點符(fu)號(hao)是否疊用、連用的錯誤。

7.jpg

▲圖中(zhong):“但其也有一些缺陷(xian),如發展速度易受資金、,人(ren)力、時間等方(fang)面的(de)限制”,標點“、,”不(bu)應該(gai)連(lian)用

大綱檢查

檢查(cha)稿件大綱(gang)的標題(ti)(ti)序號是(shi)(shi)否(fou)(fou)連續(xu),體例或格式是(shi)(shi)否(fou)(fou)一致,標題(ti)(ti)內(nei)容是(shi)(shi)否(fou)(fou)重復(fu),是(shi)(shi)否(fou)(fou)為孤標題(ti)(ti)。

8.jpg

▲圖中(zhong)“3.為加強業(ye)務(wu)管理……”中(zhong)的序(xu)號(hao)“3.”應改為“2.”

圖、表、公式、列表序號檢查

檢查稿(gao)件中(zhong)圖片(pian)、表格、公式(shi)的序號是否存在不連續、體例或格式(shi)不一致(zhi)、缺少引用的錯誤。

9.jpg

▲圖(tu)(tu)(tu)中(zhong)“圖(tu)(tu)(tu)1-6”應改成(cheng)“圖(tu)(tu)(tu)1-5”,“圖(tu)(tu)(tu)2-2”應改成(cheng)“圖(tu)(tu)(tu)2-1”

上下文查重

檢查稿件中是否存在相似度(du)較高或者完全相同的內容。

10.png

▲圖中稿件第10頁和第82頁兩句話重復,且內容完全相(xiang)同

紀年檢查

檢(jian)查稿件中的紀(ji)(ji)年類(lei)內容是否存在公(gong)元年份、干支紀(ji)(ji)年以(yi)及歷史紀(ji)(ji)年的錯誤。

11.png

▲圖中稿(gao)件“正(zheng)德(de)三年(nian)(1508)”應(ying)改為(wei)“正(zheng)德(de)三年(nian)(1713)”;“明(ming)嘉靖癸己(ji)年(nian)(1533)”應(ying)改為(wei)“明(ming)嘉靖癸巳(si)年(nian)(1533)”

格式檢查

檢查稿件中數值的千分空是否使(shi)用(yong)(yong)正(zheng)確,數值與單(dan)位符號之(zhi)間是否使(shi)用(yong)(yong)了(le)不間斷空格,以及數學符號是否使(shi)用(yong)(yong)了(le)中文全(quan)角。

12.jpg

▲圖中(zhong):“有兩個(ge)鄉(xiang)的(de)水(shui)稻(dao)平均單產(chan)都(dou)是400kg,甲鄉(xiang)的(de)水(shui)稻(dao)單產(chan)在(zai)350~450kg之(zhi)間(jian)的(de)地塊”,“400kg”和(he)“450kg”,數值和(he)單位kg之(zhi)間(jian)沒有使用不間(jian)斷空(kong)格;“%”應該使用半角格式

公式識別

方正審(shen)校還提供公(gong)(gong)式識別功能,除了能夠將(jiang)圖(tu)片格式的公(gong)(gong)式識別為可編輯(ji)的MathType公(gong)(gong)式外,還可對全文所有公(gong)(gong)式進行內容一致性檢(jian)查。

13.png

▲圖片格式的公式利(li)用公式識(shi)別功能,可(ke)以快速轉換為(wei)可(ke)編輯的文(wen)字公式

此(ci)外,該(gai)產(chan)品還(huan)內嵌正版《大辭海》,用戶(hu)可以很方(fang)便地利用該(gai)功能對稿件中(zhong)的名詞術語進行檢(jian)索。

核心技術

方(fang)正(zheng)智能(neng)輔助(zhu)審(shen)校(xiao)系統(tong)基于(yu)方(fang)正(zheng)三(san)十余年在內(nei)容(rong)處理方(fang)面的技(ji)(ji)術積累,結合(he)北京大(da)學、數(shu)字出版(ban)技(ji)(ji)術國家重(zhong)點實(shi)驗(yan)室(shi)等在自然語(yu)言處理方(fang)面的最新研究成(cheng)果,并在數(shu)十家用戶驗(yan)證反饋的基礎上(shang)研發(fa)而成(cheng)。系統(tong)采用云架(jia)構、應用機(ji)器學習(xi)和深度學習(xi),融合(he)分詞(ci)、實(shi)體識別(bie)、句法分析、深度語(yu)言模型等技(ji)(ji)術,圍繞圖書、期刊出版(ban)規范標(biao)準對(dui)內(nei)容(rong)和體例進行(xing)檢查。

通過建(jian)立(li)學科領域知(zhi)識模型和(he)(he)大(da)規模語料庫進(jin)(jin)(jin)行(xing)訓練學習(xi),基(ji)于深(shen)度(du)學習(xi)的(de)序(xu)列標注(zhu)和(he)(he)通順(shun)度(du)評價算(suan)法,利用字詞混淆對集候選結果進(jin)(jin)(jin)行(xing)綜合(he)排序(xu),并進(jin)(jin)(jin)一(yi)步結合(he)大(da)規模知(zhi)識和(he)(he)語料庫進(jin)(jin)(jin)行(xing)常(chang)識檢查,形成包括(kuo)錯別字、用詞不當、敏感詞等十二類檢查的(de)智(zhi)能化引擎,生成具有(you)可反饋(kui)學習(xi)和(he)(he)強(qiang)交互的(de)勘(kan)誤表。

14.jpg

方(fang)正智能輔(fu)助審校系統具備(bei)審校準確率(lv)高(gao)、查全(quan)(quan)率(lv)高(gao)、速(su)度快(kuai)、語料更新及時、用(yong)戶使用(yong)方(fang)便(bian)等特(te)點(dian)。在產品試(shi)用(yong)階段,已在全(quan)(quan)國范圍內100多(duo)個(ge)機構用(yong)戶試(shi)用(yong)。

未來,方正(zheng)智能(neng)輔(fu)助審校(xiao)系統還將通過人工智能(neng)技(ji)術賦(fu)能(neng)行(xing)業智能(neng)化升級,以優異(yi)的產品(pin)和(he)技(ji)術為出版行(xing)業各單(dan)位創(chuang)造更(geng)大的價值。

關于我們
北京北大方正電子有限公司(以下簡稱“方正電子”)起源于王選教授發明的漢字激光照排系統,是印刷與傳媒出版、字庫行業領先的技術、服務提供商和行業咨詢專家。 作為中國現代印刷與現代傳媒技術革命的開創者與領導者,方正電子持續推動著行業技術進步與發展,引領和創造用戶價值,業務涵蓋印刷、字庫、傳媒出版、科技期刊、大數據等領域。
關注我們
    方正電子家族網站