- 相關推薦
淺議醫院病歷檔案數字化若干問題
[摘 要]本文根據作者多年在醫院信息化部門工作經驗,對醫院病歷檔案數字化工作中涉及到的相關問題進行探討,主要涉及:數字化病歷檔案范圍的選擇、數據信息深度加工的內容、相關掃描參數的設定、圖像處理的要點、數字化加工組織形式的優劣分析、OCR識別效果的比較、PDF病歷檔案的命名方法及其他數字化工作中應注意的問題等。
[關鍵詞]病歷數字化;掃描;識別;管理
近年來,隨著各級醫院信息化建設的發展和移動醫療等互聯網醫療方式的興起,醫院的病歷檔案數字化建設在不斷升溫。全國各級醫院的信息化部門都在積極推進醫院歷史病歷檔案的數字化工作,但是各單位病歷檔案數字化工作過程中遇到一些具體問題時往往做法有很大差別,筆者根據多年來在醫院信息化部門工作實踐工作中的一些經驗,就病歷檔案數字化工作中的若干問題的觀點闡述如下:
一、正確把握病歷檔案數字化的范圍和深度
提供利用是病歷檔案數字化核心價值的重要體現之一,利用的前提是病歷檔案的數字化,但是病歷檔案數字化不能簡單的理解為掃描,不是所有的病歷組成材料都需要掃描,即病歷檔案信息的深度描述。圍繞如何全面、準確、深入地描述和加工檔案信息是檔案數字化最重要的原則。在開展檔案數字化工作之前,應先對本單位的各科室病歷檔案分類及利用情況做到詳細了解,在此基礎上開展調研,從本單位的實際需求出發,科學制定哪些分類進行數字化,哪些病歷檔案不進行數字化,哪些病歷檔案進行原文的掃描,哪些病歷檔案只進行到信息條目的著錄。
二、正確把握掃描圖像的相關參數
2.1圖像格式、分辨率的選擇
《檔案數字化技術規范》(DA/T31-2005)是各類檔案數字化的參考標準,規定采用黑白二值、灰度、彩色幾種模式對檔案進行掃描時,其分辨率一般均選擇≥100dpi。如遇到文字偏小、密集、清晰度較差等特殊狀況,需要進行OCR漢字識別的檔案,掃描分辨率可以選擇≥200dpi。而近年來實際工作中,因為醫生手寫字跡清晰度的問題很多單位在近年來病歷檔案數字化中均采用300dpi全彩掃描,圖像格式采用JEPG2000無損壓縮。
2.2圖像命名與存儲路徑
病歷檔案數字化的最初成果是以病歷檔案夾命名的圖像病歷檔案,應正確規定每一張圖片的命名,例如筆者曾經在一次數字化中采用將總頁數放進病歷檔案命名中的錯誤,如將一份18頁的病歷檔案的每一個圖片命名:1-18、2-18……目的為了提醒檢查環節注意不要缺頁,但是這種命名會導致病歷檔案名稱為10-18、11-18等頁在排序中出現錯誤,這樣在生成PDF病歷檔案的時候就會頁碼出錯。建議圖片的命名選擇六位字符(位數不宜過長),如000001、000002以此類推。另外,根據數字化的工作模式,一般應以病歷檔案的件號作為圖像存儲的最底層病歷檔案夾,且病歷檔案夾的命名位數要與檔案數據一致,比如病歷號為“15”,數據條目應“病歷號”應著錄“015”,存儲病歷檔案的病歷檔案夾命名也應為“015”。
2.3掃描圖像的處理
掃描后的原始病歷圖像需要進行優化處理,使得成品圖像清晰、端正。圖像處理后保證圖像信息與原病歷檔案內容完全一致,不刪除頁面任何有用信息。根據檔案掃描后的具體情況,除常規處理外要特別進行如下圖像處理:
(1)圖像歪斜:采用自動或手動糾偏功能,調整圖像角度。方向不正確的圖像應進行旋轉還原,以符合閱讀習慣。
(2)圖像臟點、臟斑:對圖像頁面中出現的影響圖像質量的雜質如黑點、黑線、黑框、黑邊等應進行去污處理。處理過程中應遵循保持檔案原貌的原則。
(3)字跡洇透:采用字跡銳化的功能,清晰字跡筆畫。
(4)圖像深淺不一:采用平衡功能,調整圖像深淺一致。
應注意以下兩個誤區:一是邊界的過分剪裁,有的單位在進行數字化工作中對于病歷檔案頁碼剪裁的過多,或者采用批量剪裁的方式,這種情況會對有領導批示及其他重要信息的病歷檔案造成損失;二是部分單位對病歷檔案的底色的過分漂白,力求頁面美觀,這種做法完全沒有必要,保持檔案病歷檔案的原始面貌是維護檔案真實、完整的重要內容。
三、病歷檔案數字化加工組織形式的優劣比較
3.1沒有數字化加工系統,單兵作戰
有的數字化單位采用若干計算機組成局域網,以病歷檔案共享的形式進行數字化工作,不同的計算機分別進行檔案條目信息著錄、圖像掃描、圖像處理、批量掛接等環節,這種通過病歷檔案共享方式調取的形式容易出錯,不同的環節都有對數據的可操作性,容易修改或刪除圖像,影響正確率。
3.2采用數字化加工系統,系統作戰
隨著檔案數字化工作的發展,專業性較強的單位為提高工作效率、加強質量控制,一般都根據自身經驗開發了應用軟件,專門進行檔案數字化流程控制的專業檔案數字化加工系統應運而生,將檔案數字化的全部工序納入系統管理中,環環相扣,將控制、檢驗納入數字化環節中,最終實現效率與質量的同步提高。
筆者多次參與病歷檔案數字化加工管理工作,認為采用數字化加工系統進行的病歷檔案數字化加工項目,效率明顯優于沒有數字化加工系統的項目,更為重要的是在檔案數字化加工項目中效率和最終的準確率之間存在著正比關系。
四、關于病歷檔案的OCR識別方式
病歷檔案數字化可以為全文檢索提供支持,重要的要應用支持是OCR技術,大多數字化廠商選擇國內的漢王、文通的OCR程序進行二次開發,通過API調用其程序完成識別。近年來使用俄羅斯ABBYY公司識別技術的單位越來越多,筆者對漢王和ABBYY兩者進行對比,漢王識別的速度要快,但是準確率比ABBYY要低;ABBYY識別速度很慢,但準確率相對較高,建議數字化中使用ABBYY的識別技術,其接口簡單易用,可以選擇不同程度的設置來控制病歷檔案轉換的過程及結果。
【淺議醫院病歷檔案數字化若干問題】相關文章:
淺議醫院財務原始憑證的審計05-23
淺議民事再審程序06-04
淺議移動電視節目05-29
淺議遠程機械設計06-12
淺議行政公益訴訟論文04-13
淺議集體違法的成因及對策06-04
淺議對比語言學08-21
試析醫院人事檔案管理問題與對策05-18
淺議蘇聯蒙太奇學派論文04-16
淺議企業的投標策略與報價技巧06-04