Tin mới nhất

Menu

Browsing "Older Posts"

Bài Viết Về Chủ Đề " Optical Character Recognition "

Chia Sẻ Khóa Học Optical Character Recognition (OCR) Trong Python [Khóa 7621 A]

28 tháng 11 2022 / No Comments

OpenCV, Tesseract, EasyOCR và EAST được áp dụng cho hình ảnh và video! Tạo OCR của riêng bạn từ đầu bằng Deep Learning!

Bạn sẽ học được gì:

  • ✓ Sử dụng các công cụ Tesseract, EAST và EasyOCR để nhận dạng văn bản trong hình ảnh và video.
  • ✓ Hiểu sự khác biệt giữa OCR trong môi trường được kiểm soát và tự nhiên.
  • ✓ Áp dụng các kỹ thuật tiền xử lý hình ảnh để cải thiện chất lượng hình ảnh, chẳng hạn như: thresholding, inversion, resizing, morphological operations và noise reduction.
  • ✓ Sử dụng kiến ​​trúc EAST và thư viện EasyOCR để có hiệu suất tốt hơn trong các cảnh tự nhiên.
  • ✓ Đào tạo một OCR từ đầu bằng cách sử dụng Deep Learning và Convolutional Neural Networks.
  • ✓ Ứng dụng các kỹ thuật natural language processing trong các văn bản được trích xuất bởi OCR (word cloud và named entity recognition).
  • ✓ Đọc biển số xe.

Trong lĩnh vực Computer Vision là lĩnh vực phụ của Optical Character Recognition (OCR), nhằm mục đích chuyển đổi hình ảnh thành văn bản. OCR có thể được mô tả là chuyển đổi hình ảnh chứa văn bản được đánh máy, viết tay hoặc in thành các ký tự mà máy có thể hiểu được. Có thể chuyển đổi các tài liệu được scan hoặc chụp ảnh thành văn bản có thể được chỉnh sửa trong bất kỳ công cụ nào, chẳng hạn như Microsoft Word. Một ứng dụng phổ biến là đọc biểu mẫu tự động, trong đó bạn có thể gửi ảnh thẻ tín dụng hoặc bằng lái xe của mình và hệ thống có thể đọc tất cả dữ liệu của bạn mà không cần phải nhập chúng theo cách thủ công. Ô tô tự lái có thể sử dụng OCR để đọc các biển báo giao thông và một bãi đỗ xe có thể đảm bảo việc ra vào bằng cách đọc biển số của ô tô!

Để đưa bạn đến lĩnh vực này, trong khóa học này, bạn sẽ học trên thực tế cách sử dụng thư viện OCR để nhận dạng văn bản trong hình ảnh và video, tất cả code được triển khai từng bước bằng ngôn ngữ lập trình Python! Chúng tôi sẽ sử dụng Google Colab, vì vậy bạn không phải lo lắng về việc cài đặt thư viện trên máy của mình, vì mọi thứ sẽ được phát triển trực tuyến bằng GPU của Google! Bạn cũng sẽ tìm hiểu cách xây dựng OCR của riêng mình từ đầu bằng cách sử dụng Deep Learning và Convolutional Neural Networks ! Dưới đây bạn có thể kiểm tra các chủ đề chính của khóa học:

  • ✓ Nhận dạng văn bản trong hình ảnh và video bằng Tesseract, EasyOCR và EAST.
  • ✓ Tìm kiếm các cụm từ cụ thể trong hình ảnh bằng cách sử dụng regular expressions.
  • ✓ Các kỹ thuật để cải thiện chất lượng hình ảnh, chẳng hạn như: thresholding, color inversion, grayscale, resizing, noise removal, morphological operations và perspective transformation.
  • ✓ Kiến trúc EAST và thư viện EasyOCR để có hiệu suất tốt hơn trong các cảnh tự nhiên.
  • ✓ Đào tạo một OCR từ đầu bằng cách sử dụng TensorFlow và các kỹ thuật Deep Learning hiện đại, chẳng hạn như Convolutional Neural Networks.
  • ✓ Ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên trong các văn bản được trích xuất bởi OCR (word cloud và named entity recognition).
  • ✓ Đọc biển số xe.

Đây chỉ là một số chủ đề chính! Khi kết thúc khóa học, bạn sẽ biết mọi thứ bạn cần để tạo các dự án nhận dạng văn bản của riêng mình bằng OCR!

Mục lục:

  • ✓ 01. Giới thiệu.
  • ✓ 02. OCR với Tesseract.
  • ✓ 03. Các Kỹ thuật cho Image Pre-Processing.
  • ✓ 04. OCR với EAST for Natural Scenes.
  • ✓ 05. Training một custom OCR.
  • ✓ 06. Natural scenarios với EasyOCR.
  • ✓ 07. OCR trong Video.
  • ✓ 08. Project 1: Tìm kiếm các thuật ngữ cụ thể.
  • ✓ 09. Project 2: Scanner + OCR.
  • ✓ 10. Project 3: License plate reading (Đọc biển số xe).
  • ✓ 11. Nội dung bổ sung 1: Artificial neural networks.
  • ✓ 12. Nội dung bổ sung 2: Convolutional neural networks.

Khóa học này dành cho ai:

  • ✓ Bất kỳ ai quan tâm đến OCR (Optical Character Recognition).
  • ✓ Sinh viên đại học đang theo học các môn học liên quan đến Trí tuệ nhân tạo, Xử lý ảnh kỹ thuật số hoặc Thị giác máy tính.
  • ✓ Các nhà khoa học dữ liệu muốn nâng cao kiến ​​thức về Thị giác máy tính.
  • ✓ Các chuyên gia quan tâm đến việc phát triển các giải pháp nhận dạng ký tự quang học chuyên nghiệp.
  • ✓ Những người quan tâm đến việc tạo OCR tùy chỉnh của riêng họ.


NHẬN GET EBOOK TRÊN AMAZON THEO YÊU CẦU




Copyright Disclaimer:
This site does not store any files on its server. We only index and link to content provided by other sites. Please contact the content providers to delete copyright contents if any and email us, we'll remove relevant links or contents immediately.
Tuyên bố miễn trừ bản quyền:
Trang web này không lưu trữ bất kỳ tệp nào trên máy chủ của nó. Chúng tôi chỉ lập chỉ mục và liên kết đến nội dung được cung cấp bởi các trang web khác. Vui lòng liên hệ với các nhà cung cấp nội dung để xóa nội dung bản quyền nếu có và gửi email cho chúng tôi, chúng tôi sẽ xóa các liên kết hoặc nội dung có liên quan ngay lập tức.