nang cao ket qua tim kiem tren dam may cho cac tep pdf chua hinh anh

Nâng cao kết quả tìm kiếm trên đám mây cho các tệp PDF chứa hình ảnh

Sử dụng Google Cloud Search để tìm thông tin bạn cần khi làm việc, ở mọi nơi, bằng máy tính xách tay, điện thoại di động hoặc máy tính bảng. Google Cloud Search tìm kiếm trong nội dung của tổ chức bạn trên các dịch vụ Google Workspace. Bạn có thể nhanh chóng tìm thấy thông tin mình cần từ các nguồn nội dung của tổ chức như văn bản, hình ảnh, các tệp PDF,.. Tin vui cho mọi người, mới đây Google đã cập nhật nâng cao khả năng tìm kiếm cho tệp PDF chứa hình ảnh.

Cloud Search hiện hỗ trợ trích xuất văn bản dựa trên nhận dạng ký tự quang học (OCR) cho các tệp PDF chứa hình ảnh, chẳng hạn như: 

  • Tài liệu hợp đồng bản cứng  
  • Tài liệu kỹ thuật có chứa chú thích hoặc nhãn 
  • Hóa đơn khách hàng thực và hơn thế nữa

Điều này làm cho các tệp PDF có hình ảnh chứa văn bản, chẳng hạn như tài liệu được quét, người dùng có thể dễ dàng tìm kiếm và cải thiện khả năng phát hiện của các tệp PDF đó. 

Nhiều tài liệu kinh doanh quan trọng ở bản cứng hoặc dưới dạng phiên bản quét của các tài liệu bản cứng đó. Với hỗ trợ OCR, giờ đây, quản trị viên có thể dễ dàng lập chỉ mục các tài liệu này cho Cloud Search, giúp người dùng dễ dàng tìm nhanh các tài liệu được quét có liên quan. 

Ngoài ra, tính năng này giúp loại bỏ nhu cầu trích xuất văn bản ngoại tuyến khỏi các tệp PDF chứa hình ảnh trước khi lập chỉ mục các tài liệu này trên Cloud Search

Google Cloud Search cũng sử dụng OCR để trích xuất văn bản từ các loại tệp sau:

tim kiem nang cao pdf co hinh anh

Lưu ý: Cloud Search chỉ sử dụng OCR cho các tệp PDF ở ASYNCHRONOUS chế độ và áp dụng OCR cho 80 trang đầu tiên của tệp PDF. Để đủ điều kiện cho OCR, tệp PDF chỉ được chứa hình ảnh được quét. Nếu tệp PDF chứa bất kỳ nội dung văn bản gốc nào, Cloud Search sẽ lập chỉ mục nội dung gốc và không áp dụng OCR cho hình ảnh. 

OCR cũng hoạt động trên các tệp có các đặc điểm sau:

  • Tài liệu viết tay. Các tài liệu bằng chữ Latinh, tiếng Nhật và tiếng Hàn mang lại kết quả tốt nhất.
  • Các tài liệu được viết theo chiều dọc, chẳng hạn như các tài liệu bằng tiếng Nhật.
  • Tài liệu viết từ phải sang trái, chẳng hạn như tiếng Do Thái.

Quả là một tính năng hữu hiệu giúp cho người dùng tiết kiệm thời gian tìm kiếm tài liệu. Tính năng này hiện đã khả dụng cho tất cả người dùng Google, còn chần chờ gì nữa mà không khám phá ngay cùng GCS. 

Hãy tiếp tục theo dõi GCS để cập nhật những tin tức mới nhất từ Google Workspace tại Blog Tin Tức GCS nhé.

Hãy liên hệ với GCS để chúng tôi được tư vấn và hỗ trợ giải pháp tốt nhất cho doanh nghiệp của bạn

"GCS.vn là một thương hiệu thuộc Tập đoàn HVN – đối tác chính thức do Google ủy quyền cung cấp các giải pháp điện toán đám mây của Google tại thị trường Việt Nam và khu vực Châu Á – Thái Bình Dương. GCS rất mong được đồng hành cùng quý khách hàng trên con đường phát triển và nhận được sự tin tưởng từ phía quý khách hàng."

Leave a Comment

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Scroll to Top