คำนิยาม OCR

OCR เป็นตัวย่อของ การรู้จำอักขระด้วยแสง ซึ่งเป็นภาษาอังกฤษที่สามารถแปลเป็นการ รู้จำอักขระด้วยแสง แนวคิดนี้ใช้ใน วิทยาการคอมพิวเตอร์ เพื่อตั้งชื่อกระบวนงานที่อนุญาตให้แปลงข้อความเป็นดิจิทัลผ่าน เครื่องสแกน

กรณีของ OCR นั้นมีความพิเศษมากเพราะมันทำให้คอมพิวเตอร์มีทักษะที่เป็นพื้นฐานสำหรับมนุษย์ส่วนใหญ่: การอ่าน มันเป็นเรื่องที่ควรค่าแก่การกล่าวถึงว่ามันไม่ใช่เรื่องง่ายสำหรับเราคนใดคนหนึ่งแม้ว่าในกรณีของเราเรามักจะเรียนรู้ที่จะทำมันตั้งแต่อายุยังน้อยซึ่งเป็นเหตุผลว่าทำไมเราถึงได้ทักษะที่ดีเยี่ยม

แม้จะมีความก้าวหน้าของ เทคโนโลยี OCR ยังคงประสบปัญหาหลายประการ การให้ระบบดิจิทัลรับรู้ข้อความที่เขียนด้วยลายมือเช่นนั้นค่อนข้างยาก กระบวนการมักจะพบกับความไม่สะดวกในการแบ่งกลุ่มหน่วยข้อความต่างๆ สิ่งเดียวกันนี้จะเกิดขึ้นเมื่อคำต่างๆเข้ามาใกล้กันมาก

ความผิดพลาด OCR อื่น ๆ สามารถปรากฏขึ้นได้เมื่อมีความแตกต่างระหว่างคำและพื้นหลังไม่เพียงพอ สมมติว่าข้อความที่เขียนด้วยตัวอักษรสีดำพิมพ์บนแผ่นสีเทา: เป็นไปได้ว่ากระบวนการ OCR ไม่สามารถแยกแยะตัวอักษรและ คำต่าง ๆ ได้

อย่าลืมว่าเช่นเดียวกับการ กระทำที่ เรียบง่ายเหมือนเดินไปตามถนนต้องมีการกระทำที่ประกอบกันหลายอย่างเพื่อหลีกเลี่ยงอุปสรรคและปกป้องความซื่อสัตย์ของเราการอ่านข้อความที่พิมพ์เป็นผลมาจากภารกิจลาดตระเวนหลายครั้ง เกือบหมดสติ แต่พวกเขาก็พาเราทำงาน

เมื่อเผชิญกับข้อความ ระบบ OCR ของเรามีหน้าที่ในการค้นหาและจดจำชื่อระบุย่อหน้าเครื่องหมายวรรคตอนเว้นวรรคระหว่างคำและตัวย่อในองค์ประกอบอื่น ๆ รวมถึงพยายามทำความเข้าใจแหล่งที่มา หรูหราเกินไปหรือไม่เรียบร้อยและเพื่อให้ข้อมูลในภูมิภาคที่ประสบกับการสึกหรอทุกประเภทเช่นคราบหมึกหรือกระดาษขาดหายไป

แนะนำ