Nâng cao kết quả tìm kiếm trên đám mây cho các tệp PDF chứa hình ảnh
Sử dụng Google Cloud Search để tìm thông tin bạn cần khi làm việc, ở mọi nơi, bằng máy tính xách tay, điện thoại di động hoặc máy tính bảng. Google Cloud Search tìm kiếm trong nội dung của tổ chức bạn trên các dịch vụ Google Workspace. Bạn có thể nhanh chóng tìm thấy thông tin mình cần từ các nguồn nội dung của tổ chức như văn bản, hình ảnh, các tệp PDF,.. Tin vui cho mọi người, mới đây Google đã cập nhật nâng cao khả năng tìm kiếm cho tệp PDF chứa hình ảnh.
Tổng quan về Nâng cao kết quả tìm kiếm trên Cloud Search cho các tệp PDF chứa ảnh
Cloud Search hiện hỗ trợ trích xuất văn bản dựa trên nhận dạng ký tự quang học (OCR) cho các tệp PDF chứa hình ảnh, chẳng hạn như:
- Tài liệu hợp đồng bản cứng
- Tài liệu kỹ thuật có chứa chú thích hoặc nhãn
- Hóa đơn khách hàng thực và hơn thế nữa
Điều này làm cho các tệp PDF có hình ảnh chứa văn bản, chẳng hạn như tài liệu được quét, người dùng có thể dễ dàng tìm kiếm và cải thiện khả năng phát hiện của các tệp PDF đó.
Nhiều tài liệu kinh doanh quan trọng ở bản cứng hoặc dưới dạng phiên bản quét của các tài liệu bản cứng đó. Với hỗ trợ OCR, giờ đây, quản trị viên có thể dễ dàng lập chỉ mục các tài liệu này cho Cloud Search, giúp người dùng dễ dàng tìm nhanh các tài liệu được quét có liên quan.
Ngoài ra, tính năng này giúp loại bỏ nhu cầu trích xuất văn bản ngoại tuyến khỏi các tệp PDF chứa hình ảnh trước khi lập chỉ mục các tài liệu này trên Cloud Search.
Google Cloud Search cũng sử dụng OCR để trích xuất văn bản từ các loại tệp sau:
Lưu ý: Cloud Search chỉ sử dụng OCR cho các tệp PDF ở ASYNCHRONOUS chế độ và áp dụng OCR cho 80 trang đầu tiên của tệp PDF. Để đủ điều kiện cho OCR, tệp PDF chỉ được chứa hình ảnh được quét. Nếu tệp PDF chứa bất kỳ nội dung văn bản gốc nào, Cloud Search sẽ lập chỉ mục nội dung gốc và không áp dụng OCR cho hình ảnh.
OCR cũng hoạt động trên các tệp có các đặc điểm sau:
- Tài liệu viết tay. Các tài liệu bằng chữ Latinh, tiếng Nhật và tiếng Hàn mang lại kết quả tốt nhất.
- Các tài liệu được viết theo chiều dọc, chẳng hạn như các tài liệu bằng tiếng Nhật.
- Tài liệu viết từ phải sang trái, chẳng hạn như tiếng Do Thái.
Quả là một tính năng hữu hiệu giúp cho người dùng tiết kiệm thời gian tìm kiếm tài liệu. Tính năng này hiện đã khả dụng cho tất cả người dùng Google, còn chần chờ gì nữa mà không khám phá ngay cùng GCS.
Hãy tiếp tục theo dõi GCS để cập nhật những tin tức mới nhất từ Google Workspace tại Blog Tin Tức GCS nhé.
Nếu bạn đang trong quá trình tìm hiểu về nội dung bài viết này và gặp băn khoăn thì hãy kết nối ngay với GCS.vn bằng cách gọi điện tới Hotline: 024.9999.7777 hoặc để lại thông tin ở phần Chatbox bên dưới, chúng tôi sẽ giúp bạn giải đáp mọi thắc mắc nhanh nhất trong vòng 1 ngày.