Jump to content


Hình ảnh
- - - - -

Nhận dạng tiếng Việt sử dụng ABBY Fine Reader 9 Pro


  • Please log in to reply
1 reply to this topic

#1 oriondream

oriondream

    Dân FOTECH

  • Member of FOTECH Assembly
  • PipPipPipPipPip
  • 1946 bài viết
  • Giới tính:Nam
  • Nơi sống:Australia

Gửi lúc 24 Apr 2010 - 10:27 PM

ABBY Fine Reader 9 Pro là phần mềm nhận dạng kí tự quang học (OCR) mạnh hỗ trợ nhiều ngôn ngữ nhưng không trực tiếp hỗ trợ tiếng Việt. Trong bài viết này, tôi xin giới thiệu cách ứng dụng phần mềm này vào việc nhận dạng tiếng Việt.

I. Thiết lập
Sau khi cài đặt ABBY Fine Reader
1. Chọn Tools -> Language Editors hoặc bấm tổ hợp phím Ctrl + Shift + L
Tệp đính kèm  abby-language editor.png   11.87KB   138 Lượi tải

2. Trong cửa sổ Language editor, bấm New
Tệp đính kèm  abby-language Properties.png   11.23KB   111 Lượi tải

3. Trong cửa sổ New Language or Group Chọn Create a new language based on an existing one và chọn Latin trong cửa sổ thả xuống
Tệp đính kèm  abby-New Language or Group.png   8.66KB   151 Lượi tải

4. Trong cửa sổ Language Properties điền Vietnamese
Tệp đính kèm  abby-language Properties.png   11.23KB   111 Lượi tải

5. Bấm nút 3 chấm (...) Trong mục Alphabet của cửa sổ Language Properties để mở ra cửa sổ Alphabet
Tệp đính kèm  abby-Alphabet.png   13.08KB   164 Lượi tải
Cửa sổ này cho phép bạn chọn các kí tự sẽ nhận dạng thành tiếng Việt. Bạn hãy chọn các kí tự của tiếng Việt từ các subrange sau:
- Basic latin
Tệp đính kèm  abby-Alphabet-Basic Latin.png   13KB   178 Lượi tải
- Latin-1 Supplement
Tệp đính kèm  abby-Alphabet-Latin Supplement.png   13.13KB   178 Lượi tải
- Latin Extended A
Tệp đính kèm  abby-Alphabet-Latin Extended-A.png   14.26KB   190 Lượi tải
- Latin Extended B
Tệp đính kèm  abby-Alphabet-Latin Extended-B.png   14.77KB   177 Lượi tải
- Latin Extended Additional
Tệp đính kèm  abby-Alphabet-Latin Extended-Additional.png   15.87KB   256 Lượi tải

6. Giải nén & copy file mẫu học Tệp đính kèm  Vietnamese.rar   339.48KB   384 Lượi tải vào trong thư mục đang làm việc và đặt nó thành active với nút Set Active. Lưu ý: Bạn cũng có thể tự tạo file mẫu học này. Xin xem phía dưới
Tệp đính kèm  abby-Alphabet-Pattern Editor.png   8.59KB   259 Lượi tải

II. Huấn luyện
Sau khi file mẫu học đã được tạo và Set Active, để nâng cao độ chính xác, bạn cần huấn luyện ABBY.
1. Trong Tools->Options, tab 2. Read chọn Train User Pattern trong phần training
Tệp đính kèm  ABBY-Optrions-Training.png   21.25KB   269 Lượi tải

2. Chọn một vài trang để tiến hành huấn luyện, bấm chuột phải và chọn Read. ABBY sẽ lần lượt xin ý kiến bạn về kí tự
Tệp đính kèm  ABBY-Pattern Training.png   226.61KB   189 Lượi tải
  • 1

oriondream.png

 


#2 linkinsteps

linkinsteps

    Prog fan...

  • Super Moderator
  • PipPipPipPipPip
  • 2672 bài viết
  • Giới tính:Nam
  • Nơi sống:K51CA
  • Sở thích:]V[usic

Gửi lúc 25 Apr 2010 - 04:59 PM

Anh oriondream cho em hỏi ABBY dùng mô hình huấn luyện nào thế ? Các anh có share được module nào không ạ ? (Feature Extraction hoặc training ý) :D
  • 0
... and the season of the fall begins ....




0 người đang đọc chủ đề này

0 thành viên, 0 khách, 0 thành viên ẩn