PaddleOCR Mengungguli Tesseract untuk Menjadi Proyek OCR Teratas di GitHub dengan 5 Juta Parameter

robot
Pembuatan abstrak sedang berlangsung

Menurut pemantauan dari 1M AI News, pustaka alat OCR sumber terbuka milik Baidu, PaddleOCR, telah melampaui mesin OCR andalan Google yang sudah lama berdiri, Tesseract, dengan 73.300 bintang di GitHub dibandingkan Tesseract yang memiliki 73.200, sehingga menjadikannya proyek OCR dengan penilaian tertinggi di platform tersebut. Peringkat ketiga MinerU memiliki 57.500 bintang. PaddleOCR dirilis sebagai open-source pada 2020 dan mendukung lebih dari 100 bahasa, mencakup lebih dari 160 negara dan wilayah. PaddleOCR baru-baru ini menjalani pembaruan intensif, dengan rilis PP-OCRv5 minggu lalu, yang hanya memiliki 5 juta parameter dan mencapai akurasi yang sebanding dengan model bahasa visual bermiliar parameter pada tolok ukur OCR standar. Selain itu, PaddleOCR-VL-1.5 mencatat rekor baru dengan tingkat akurasi 94,5% pada benchmark penguraian dokumen OmniDocBench v1.5.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan