avatar

duyminh

Posts: 4,375

Site Admin

Lead

Nov 19 08 9:48 PM

Tags : :

image
image


Bạn cần tổng hợp thông tin từ nhiều loại giấy tờ, sách báo ư ? Thật là đơn giản nếu như bạn đã có một bộ Máy tính, Scanner (máy quét) thì hãy mua Phần mềm Nhận dạng chữ Việt in VnDOCR 4.0, tức là bạn đã tiết kiệm được rất nhiều công sức cũng như tiền bạc.

Môi trường
+ PC với hệ điều hành Windows 9x, Windows ME, Windows 2000, Windows XP hoặc Windows NT, Tiện ích : Bộ gõ chữ Việt và bộ phông ABC, VNI, Unicode..

Thông tin đưa vào
+ Quét trực tiếp các loại sách báo, văn bản qua máy quét (scanner).

+ Đọc và xử lý hơn 30 dạng tệp tin ảnh phổ dụng nhất như PCX, BMP, TIF, GIF, JPG, ...

Có thể nhận dạng trực tiếp tài liệu quét qua scanner, không cần lưu trữ dưới dạng tệp ảnh trung gian. Các trang tài liệu có thể được quét và lưu trữ dưới dạng tệp tin nhiều trang.

Có thể là các dạng tệp tin của Microsoft Word (.doc), tệp ký tự ASCII (.txt), Rich Text Format (.rtf), *.xls (đối với bảng biểu).

Độ chính xác 99 % ! VnDOCR cũng nhận dạng các tài liệu đã qua Photocopy.
http://www.vndocr.com

Download:
http://www.phamduyminh.com/Software/OCR%20Tools/VnDOCR%20v4.0%20Professional.rar
Pass: www.phamduyminh.com

https://www.orbitfiles.com/download/id293692403.html

VnDOCR Professional 3.0
http://www.vndocr.com/upload/vndocrdemo30.zip

VnDOCR 4 Demo version
http://www.vndocr.com/upload/vndocr40demo.zip

http://quansuvietnam.googlepages.com/HDSD_VNDOCR_4.pdf

Website: www.phamduyminh.com
Forum: http://forum.phamduyminh.com
http://diendan.phamduyminh.com

Let's share to be shared.
Hãy chia sẻ để được sẻ chia.

Quote    Reply   
avatar

duyminh

Posts: 4,375 Site Admin

#1 [url]

Nov 19 08 9:56 PM

Sử dụng hiệu quả VnDOCR 4.0 Demo

image

Nếu bạn đã sử dụng VnDOCR 4.0 bản demo để biến văn bản tiếng Việt in trên giấy thành file vi tính mà chưa được hài lòng cho lắm thì hãy thử xem qua kinh nghiệm dưới đây.

Đối với các trang gồm chữ đen trên nền giấy trắng thì kết quả rất khả quan, có thể đạt được đến 97, 98%. Riêng những trang có background là màu thì tùy theo màu nền mà VnDOCR có thể nhận dạng được (rất thấp) hoặc không nhận dạng được.

Sau đây là các bước thực hiện để đạt được hiệu quả cao trong khi sử dụng VnDOCR 4.0:

1. Bạn có thể scan trực tiếp từ máy scan chứ không nhất thiết phải chọn scan từ trong chương trình VnDOCR. Khi scan trực tiếp, bạn chọn Scan to File.

Trong ô Image Type, bạn chọn Text/Line Art (chỉ có ở dạng Text/Line Art thì VnDOCR mới nhận dạng được) chứ đừng chọn Color Document hay Black & White Document. Trong ô Destination, bạn chọn Epson Stylus Printer (Fine).

Trong ô Resolution, bạn chọn độ phân giải là 400 dpi. Bạn có thể chọn độ phân giải là 300 dpi hoặc thấp hơn tùy ý, tuy nhiên, VnDOCR khuyến cáo là chỉ nhận dạng tốt nhất ở độ phân giải 400 dpi mà thôi.

2. Sau khi scan xong, trong ô Type Format, bạn phải chọn save theo dạng file TIFF- uncompressed (+.TIF) thì VnDOCR mới có thể nhận dạng được.

Đây là điều quan trọng, vì nếu bạn lỡ quên mà save theo dạng +.JPG hoặc +.BMP thì sau này, dù bạn có chuyển đổi sang dạng TIF, VnDOCR cũng không nhận dạng được.

3. Bây giờ bạn khởi động VnDOCR, trong cửa sổ VnDOCR 4.0, nhấp nút Chấp nhận. Vào menu Tệp > Đọc ảnh, mở file vừa scan. Bên cửa sổ phía trái sẽ hiện ra nội dung của file được mở ra.

Nếu lúc nầy, bạn vào menu Xử lý > Nhận dạng thì VnDOCR sẽ mặc nhiên chọn chế độ phân vùng tự động và có thể nó sẽ phân vùng sai và định dạng sai một số vùng. Do đó bạn nên vào menu Xử lý > Đánh dấu vùng bằng tay / Tạo mới.

Lúc nầy, con trỏ sẽ đổi dạng thành dấu cộng lớn. Bạn đưa dấu cộng vào điểm khởi đầu của vùng muốn nhận dạng, nhấp và giữ phím chuột trái rồi kéo rê đến điểm cuối của vùng muốn chọn, xong thả ra.

VnDOCR sẽ đánh dấu vùng được chọn bằng một khung hình chữ nhật. Nếu vùng được chọn không đúng theo ý mình, bạn có thể xoá nó đi bằng cách đưa con trỏ chuột vào khung chữ nhật rồi nhấp phím phải chuột. Một menu con hiện ra, bạn nhấp chọn mục
Xóa, khung chữ nhật sẽ biến mất.

Bây giờ bạn có thể làm lại thao tác vừa rồi để chọn vùng khác. Bạn có thể chọn nhiều vùng và mỗi vùng bạn chọn, VnDOCR sẽ đánh dấu bằng một con số. Nếu văn bản có nhiều cột và hình, bạn có thể chọn tiếp các vùng khác và không chọn hình ảnh. Sau khi chọn xong, bạn vào menu Xử lý > Nhận dạng.

VnDOCR sẽ lần lượt nhận dạng các khung chữ nhật mà bạn đã đánh dấu thành vùng 1, 2, 3...

Sau khi nhận dạng xong, VnDOCR sẽ đưa các vùng được nhận dạng sang cửa sổ phía bên tay mặt. Trong mỗi khung chữ nhật là văn bản mà VnDOCR đã nhận dạng xong, những ký tự hoặc các từ hay đoạn văn mà VnDOCR nghi ngờ là không đúng sẽ được thể hiện bằng màu đỏ. Tuy nhiên, các từ màu đen cũng vẫn có thể bị sai, cho nên bạn hãy tô đen tất cả để tránh bị rối mắt.

4. Vì bản VnDOCR của chúng ta đang sử dụng là bản demo (không mất tiền mua) cho nên VnDOCR không cho chúng ta lưu lại thành file Word. Nhưng bạn đừng lo, chúng ta sẽ đánh dấu từng vùng đã được nhận dạng trong khung chữ nhật (bôi đen) rồi copy vào clipboard, đem paste vào một file mới trong Word rồi save lại.

5. VnDOCR nhận dạng và thể hiện văn bản với font .VnTime (font ABC - TCVN3). Nếu máy bạn không có font này hoặc có nhưng muốn chuyển sang font thuộc bảng mã khác thì có thể dùng các chương trình chuyển mã để thực hiện như bình thường.

Sau khi chuyển mã xong, bạn chọn toàn bộ văn bản (Ctrl-A), vào menu Format > Font, chọn font color là Automatic (màu đen), chọn font size sao cho dễ đọc và biên tập lại được dễ dàng (cỡ 12 hay 14).

Bạn chú ý, khi quét ảnh văn bản phải chọn chế độ quét ra là ảnh đen trắng (16 bit) thì VnDOCR mới nhận dạng được. Trong quá trình scan cho phép mình điều chỉnh chế độ màu, size và độ phân giải.. bạn chỉ cần chú ý chuyển qua chế độ màu đen trắng là được.

Website: www.phamduyminh.com
Forum: http://forum.phamduyminh.com
http://diendan.phamduyminh.com

Let's share to be shared.
Hãy chia sẻ để được sẻ chia.

Quote    Reply   
avatar

duyminh

Posts: 4,375 Site Admin

#2 [url]

Nov 19 08 10:09 PM

Sử dụng VnDOCR 4.0 thông qua "mẹo" Aqua Deskperience

image

VnDOCR là chương trình nhận dạng ký tự tiếng Việt. Phiên bản 3.0 Demo đã được sử dụng lâu nay.

Thời gian trước đây, VnDOCR 4.0 cũng đã chính thức ra mắt. Trong phiên bản 4.0 này, chương trình hỗ trợ hoàn toàn bảng mã Unicode (bản 2.0 chỉ có VNI - Time và TCVN3) và theo nhà sản xuất, chất lượng nhận dạng của phiên bản 4.0 thông minh và hiệu quả hơn người anh của nó.

Thế nhưng, bản 4.0 mà nhà sản xuất phát hành cho người dùng miễn phí cũng là bản demo và hạn chế rất nhiều chức năng như: chỉ cho nhận dạng tối đa 3 file ảnh, không cho copy và sao lưu (save).

Vỏ quýt dày có móng tay nhọn, ông bà ta chẳng từng nói thế là gì. "Móng tay" để "lột quýt" VnDOCR 4.0 chính là Aqua Deskperience.

Aqua Deskperience là chương trình chụp ảnh màn hình, công việc chính của nó là ghi lại những gì đang hiện diện trên màn hình, bất kể đó là hình ảnh hay văn bản, nó đều có khả năng sao chụp. Ta lợi dụng công cụ này làm phương tiện trung gian để nhờ nó copy văn bản trong VnDOCR 4.0 rồi dán qua MS Word.

Các công đoạn thực hiện như sau:

1. Bạn tải VnDOCR 4.0 và Aqua Deskperience về cài đặt

2. Mở file văn bản cần nhận dạng: Phải là file tif, quét trắng đen, độ phân giải 300dpi

3. Dùng chương trình VnDOCR 4.0 nhận dạng file xong, cửa sổ bên phải là kết quả nhận dạng

4. Mở chương trình Aqua Deskperience, nhấn phí tắt Ctrl + Shift rồi chọn vùng là văn bản đã được VnDOCR 4.0 nhận dạng. Chương trình xác nhận bạn có đồng ý copy văn bản trong vùng chọn không? Bạn click vào 1 mẫu văn bản để xác nhận copy.

5. Sau cùng, mở cửa sổ MS Word để dán (paste hoặc Ctrl + V) văn bản vừa copy.

Lưu ý: VnDOCR 4.0 chỉ cho bạn nhận dạng tối đa 1 lúc 3 file ảnh. Vì vậy sau khi thực hiện xong 3 file, bạn đóng rồi mở lại chương trình để nhận dạng 3 file tiếp theo.

Aqua Deskperience:
http://www.deskperience.com/Setup/AquaSetup.exe

Website: www.phamduyminh.com
Forum: http://forum.phamduyminh.com
http://diendan.phamduyminh.com

Let's share to be shared.
Hãy chia sẻ để được sẻ chia.

Quote    Reply   
avatar

duyminh

Posts: 4,375 Site Admin

#3 [url]

May 4 10 6:59 PM

Cách convert file ảnh*.jpg sang file *tif (hỗ trợ nhận diện bằng Vndocr)

cách convert file *.jpg sang file *.tif, để dùng VnDOCR 4 nhận dạng rồi chuyển sang file word, kết quả rất tốt.

Cách làm:
- Download phần mềm Image Convertor Plus từ http://www.imageconverterplus.com, các bạn cứ việc download bản Demo.
- Cài đặt và chạy phần mềm đó.
- Chụp ảnh sách bằng chế độ chụp macro, không có flash, crop lại cho gọn, chú ý đừng resize.

- Dùng Image Convertor Plus convert file đó sang *.tif ở chế độ Black & White(*), không chọn chế độ multipage:

image


- Sẽ được file *.tif như sau:

image

- Vì đây là bản Demo nên ở góc dưới bên phải bị đóng dấu, để làm mất dấu đó, thì tiếp tục dùng Image Convertor Plus, convert file *.tif vừa tạo sang *.tif ở chế độ Black & White:

image

- Sẽ được file ảnh như sau:

image

- Dùng VnDOCR 4 nhận dạng file đó:

image

- Mở một file word, kéo text từ cửa sổ VnDOCR 4 vào file word là xong.

Dưới đây là kết quả (copy từ file word):

" xác định hành xung khắc
hung ta đều biết, hành tốt
thương lại vận may, hành ~
xung mang đến vận rủi. Va mỗi _
người, ngoài việc có bốn hành _
tết thì đồng thời cúng có bốn 1

hành xung, mang lại vận rủi tùy 1
vào mức độ nặng nhẹ. Các bạn 11
có thể nghiên cứu những hành 11
này ở bảng bên. Chú ý đối với 1
quái số 5, hành trên dành cho !
nam, hành dưới dành cho nữ. 1
Hành xung khác 1
Theo phong thủy, các hành 1
được xem là xung khắc được 1
tính theo công thức này thì có 1
thề trái ngược với những hành 1
được xem là may mắn nếu
tính theo công thức khác. Tuy
nhiên, bạn nên nhớ rằng, bản thân các
hành rất ít khi gây ảnh hưởng xấu. Vấn
đề chủ yếu là bạn hãy kiềm chế việc
cung cấp năng lượng cho các hành xung
khắc Bạn không cần sử dụng các thiết
kế phức tạp, màu sắc quá cầu kỳ tượng
trưng cho những hành phù hợp với mình
vào không gian sống. Chỉ cần, nếu
đại Mộc được cho là xung
khắc với bạn, thì không nên
dùng màu xanh lá cây, bảng
gô trong nhà hoặc văn phòng
của bạn. Chú ý, các hành xung đi
khắc chỉ liên hệ chủ yếu đến
vùng không gian sống, không
liên quan đến màu sắc quần ~
áo của bạn.


Vẫn được xem là thuận lợi cho hạn- Tuy
nhiên, đặt những biểu tượng có chế
liệu bằng gỗ cây hoặc màu xanhlụt
trong vùng không gian cá nhân của lại
được xem là xấu. Đây chính là chỗ v
diệu và hài hòa của phong thủy mê
chỉ có những bậc tinh thôngthuật
~ phong thủy mới có thể áp dụ~l~
chính xác.
Bạn lưu ý, bảng ~àn**]
~ xung khắc trên chỉ xá(
định những hàng mang
~ lại vận rủi cho cá nhân
' bạn, và **lành nào sinh
l)s. hành xung khắc với bạn
mới được xem là hành
xấu nhất . Vì vậy, hạn chỉ
\ sử dụng chúng trong vùng
không gian sống cá nhân của
bạn, không áp dụng cha toà"
hộ ngôi nhà "

Chúc các bạn thành công!



Những vấn đề cần lưu ý:

* Để đảm bảo chất lượng nhận dạng, tuyệt đối không làm thay đổi dung lượng file ảnh vì tăng hay giảm dung lượng file ảnh chất lượng nhận dạng cũng giảm sút.
* Chú ý tăng chất lượng chụp ảnh.
* Không convert file sang chế độ Black & White, multi page.
* Trong trường hợp ở bước convert thứ hai sang file *tif mà không làm mất dấu đóng trên ảnh thì, ở bước convert thứ nhất chọn chế độ của file đích là True Color như trong hình minh họa thứ nhất, là dấu đóng sẽ mất sau bước convert thứ hai.

Website: www.phamduyminh.com
Forum: http://forum.phamduyminh.com
http://diendan.phamduyminh.com

Let's share to be shared.
Hãy chia sẻ để được sẻ chia.

Quote    Reply   
Add Reply

Quick Reply

bbcode help