OCR là viết tắt của Optical Character Recognition, nghĩa là nhận dạng ký tự quang học. Công nghệ OCR được tạo ra để chuyển đổi hình ảnh của chữ đánh máy hoặc chữ viết tay thành văn bản tài liệu ở dạng file mềm, dễ dàng số hoá tài liệu và lưu trữ thông tin.
Phần mềm OCR hoạt động như thế nào?
Nhận dạng kí tự quang học – OCR là công cụ hỗ trợ tự động hoá các tác vụ nhập dữ liệu và số hoá giấy tờ, đặc biệt là các tài liệu định danh. OCR có khả năng nhanh chóng chuyển đổi văn bản trên giấy thành dạng file word, giúp việc lưu trữ và tìm kiếm thông tin trở nên đơn giản, dễ dàng hơn.
Phần mềm OCR phân tích hình ảnh đưa vào theo các vùng sáng – tối, xác định vùng sáng làm nền và vùng tối dưới dạng ký tự viết. Sau đó, phần mềm OCR chuyển đổi văn bản trong hình thành văn bản kỹ thuật số. Quy trình này bao gồm các bước:
- Bước 1: Đăng tải hình ảnh lên hệ thống
- Bước 2: Tiền xử lí: Đây là quá trình lọc nhiễu, giúp hệ thống xử lí ảnh chính xác hơn. Ví dụ, ảnh quá tối thì phải tăng sáng, giảm độ mờ của ảnh.
- Bước 3: Xác định vùng chứa thông tin (Crop): Hệ thống sẽ loại bỏ vùng background thừa của ảnh. Ví dụ, ảnh CCCD chụp trên mặt bàn, hệ thống sẽ crop phần cái bàn thừa đi, bởi phần nền thừa có thể gây nhiễu cho các công đoạn phía sau.
- Bước 4: Phát hiện trường thông tin: Xác định vị trí vùng chứa thông tin trên ảnh cần trích xuất.
- Bước 5: Đọc và phân loại thông tin: Đưa các thông tin được trích xuất vào từng trường thông tin cụ thể theo yêu cầu của doanh nghiệp.
- Bước 6: Xử lý hậu kì: Chỉnh sửa các trường thông tin còn sai sót sau khi máy đọc xong.
Tham khảo: PDF Searchable và định dạng chuẩn số hóa PDF/A
Các lĩnh vực ứng dụng OCR tiếng Việt trong thực tế
Hiện nay, phần mềm OCR được ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau như:
Tài chính – Ngân hàng
Khi có nhu cầu mở tài khoản ngân hàng mới, hay tham gia gói dịch vụ tài chính, bảo hiểm, yêu cầu bắt buộc của các tổ chức này là phải định danh khách hàng bằng cách cung cấp thông tin cá nhân trên CMND/CCCD, Hợp đồng vay vay…
Bảo hiểm
Một số quy trình tiêu biểu trong lĩnh vực Bảo hiểm có thể kể đến như quy trình bồi thường bảo hiểm. Với OCR, nhân viên bảo hiểm chỉ cần một vài thao tác chụp hình đơn giản và đưa lên hệ thống, toàn bộ nội dung về bộ chứng quyền lợi bảo hiểm từ thông tin cá nhân người hưởng quyền lợi bảo hiểm, giấy ra viện, đơn thuốc, hóa đơn viện phí, cho đến kết quả xét nghiệm sẽ được nhanh chóng trích xuất và nhập liệu trên hệ thống, giảm thiểu thời gian nhập liệu, giúp nhân sự tập trung vào các nghiệp vụ chuyên sâu hơn.
Hành chính công
Khối Hành chính công cũng phải xử lí “hàng núi” giấy tờ mỗi ngày. Khi nhắc đến phải giải quyết các vấn đề hành chính tại các cơ quan nhà nước, không ít người dân cảm thấy “sợ” bởi quá nhiều thủ tục rườm rà phải thực hiện. Giải pháp OCR bước đầu đơn giản hoá, rút ngắn thời gian thực hiện việc kê khai và xác minh các giấy tờ tuỳ thân của người dân. Bên cạnh đó, việc quản lí hồ sơ người dân giúp số hoá cơ sở dữ liệu quốc gia, tiện lợi cho việc lưu trữ và tra cứu của các cơ quan hành chính.
Giao thông – Vận tải
Sở hữu công nghệ lõi mạnh mẽ, phần mềm OCR đã được Grab – ứng dụng gọi xe hàng đầu thế giới, lựa chọn tích hợp vào quy trình định danh khách hàng điện tử trên mạng lưới Grab tại 8 nước Đông Nam Á với 2,8 triệu khách hàng.
Trước đây trong quá trình định danh, các đối tác (tài xế) Grab sẽ phải nhập tay từng trường thông tin cá nhân bao gồm những thông tin như Họ tên, ngày sinh, địa chỉ, số CMND/CCCD, mã bằng lái xe… Sau đó sẽ chụp ảnh giấy tờ định danh gửi lên hệ thống và đợi xác minh tài khoản. Quy trình nhập liệu này tốn nhiều thời gian và thường xảy ra sai sót. Với OCR, toàn bộ quy trình cồng kềnh này sẽ được tinh gọn chỉ trong vài giây, tạo nên những bước nhảy bật mạnh mẽ trong cải thiện trải nghiệm người dùng.
Tham khảo: ABBYY FineReader PDF 15 Sprint: OCR Tiếng Việt cho tất cả máy scan
Xử lý hóa đơn tự động trong ngành bán lẻ
Xử lý hóa đơn tự động là phương pháp sử dụng phần mềm tích hợp công nghệ OCR – Nhận dạng ký tự quang học để trích xuất dữ liệu hóa đơn, điền thông tin vào hệ thống doanh nghiệp và quản lý kho dữ liệu.
Xử lý hóa đơn tự động có thể cắt giảm tới 80% thời gian và nguồn lực doanh nghiệp. Ngay khi tiếp nhận, hóa đơn sẽ được quét và ảnh chụp hóa đơn sẽ được hệ thống trích xuất dữ liệu phân tích. Hình thức tự động thu thập dữ liệu này cắt giảm hàng giờ nhập liệu thủ công của nhân viên. Sau đó, phần mềm tự động hóa hóa đơn sẽ tự động trích xuất và chuyển đổi dữ liệu thành dạng văn bản điện tử có thể tìm kiếm được qua vài click chuột.
Tặng phần mềm OCR Tiếng Việt khi thuê máy scan tại iScan
Với những lợi ích rõ ràng có thể nhìn thấy được, trong tương lai gần, công nghệ OCR hứa hẹn sẽ được ứng dụng vào nhiều ngành nghề và nhiều lĩnh vực khác nhau, tạo ra các bước chuyển vĩ đại trong thời đại công nghệ 4.0. Khi thuê từ 5 máy scan, iScan sẽ tặng các bạn phần mềm OCR Tiếng Việt và hỗ trợ cài đặt, hướng dẫn sử dụng tận tình.
iScan cung cấp giải pháp số hóa tài liệu chuyên nghiệp
- Cho thuê máy scan chuyên dụng khổ A3, A4.
- Phần mềm ứng dụng công nghệ OCR tiếng Việt.
- Dịch vụ số hóa tài liệu lưu trữ trọn gói chuẩn ISO.