POMA AI mencapai Pemotongan Token Terbaik dalam Pengeluaran dan Penyepaduan RAG dengan 77% Berbanding Model Konvensional

(SeaPRwire) –   Pembahagian hierarki pintar ialah penyediaan data optimum untuk penanaman pangkalan data vektor

Berlin, BERLIN, 16 Mac 2026 — POMA AI, sebuah syarikat kepintaran dokumen berpangkalan di Berlin, hari ini melancarkan POMA-OfficeQA, sebuah penanda aras sumber terbuka yang menunjukkan bahawa pembahagian dokumen sedar-strukturnya mengurangkan kos pengambilan semula RAG sebanyak 77% berbanding kedua-dua pembahagian teks naif dan pendekatan pengekstrakan elemen Unstructured.io.

POMA AI Achieves Best-in-Class RAG Chunking and Document Ingestion With 77% Token Reduction vs. Conventional Models

Secara lalai, POMA PrimeCut menggunakan 77% lebih sedikit token berbanding model konvensional. Angka ini meningkat kepada 83% apabila digunakan dalam konfigurasi tersuai.

“Setiap sistem RAG dalam pengeluaran hari ini kehilangan maklumat sebelum model itu melihatnya,” kata Dr. Alexander Kihm, pengasas & CEO POMA AI. “Industri telah mengoptimumkan penanaman, penyusun semula, dan kejuruteraan segera, tetapi lapisan penelanan adalah tempat kebanyakan kegagalan pengambilan semula sebenarnya berasal. Penanda aras ini mengukur apa yang telah dirasai oleh pengamal secara intuitif: pembahagian sedar-struktur adalah asas yang membuatkan segala-galanya di hiliran benar-benar berfungsi.”

Penanda aras penuh, yang tersedia di GitHub, menguji tiga strategi pembahagian dokumen untuk Penjanaan Ditambah-Pengambilan Semula (RAG) menggunakan penanaman yang sama, logik pengambilan semula yang sama, dan 20 soalan carian-jadual merentasi 14 Buletin Perbendaharaan AS (~2,150 muka surat). Ujian itu mengukur keupayaan setiap kaedah untuk mengambil semua bukti yang diperlukan untuk menjawab soalan fakta dengan betul, dengan metrik (ingatan konteks) menentukan belanjawan token minimum yang diperlukan oleh sistem pengambilan semula untuk menjamin semua bukti tersedia dalam konteks yang diambil.

Keputusan menunjukkan bahawa pembahagian hierarki POMA—yang mengekalkan struktur dokumen termasuk pengepala jadual, hierarki bahagian, dan hubungan semantik antara elemen kandungan—memerlukan 77% lebih sedikit token untuk mencapai ingatan konteks 100%:

  • Garis dasar (pembahagian naif dengan 500 token, 100 pertindihan): 1.45 juta
  • Unstructured.io (pengekstrakan elemen): 1.48 juta
  • POMA AI (sedar-struktur): 340k

Semua kaedah menggunakan model text-embedding-3-large OpenAI untuk penanaman dan persamaan kosinus untuk kedudukan pengambilan semula. Kebenaran asas ditetapkan menggunakan indeks bahagian tepat yang disahkan terhadap dokumen sumber — menghapuskan positif palsu daripada padanan angka kebetulan. Hanya soalan yang boleh dijawab oleh ketiga-tiga kaedah dimasukkan, memastikan perbandingan yang adil. Soalan di mana mana-mana kaedah mempunyai kegagalan pengekstrakan (ralat OCR, nilai hilang) dikecualikan.

“Apa yang meyakinkan kami tentang POMA ialah ketegasan kejuruteraan di sebalik pandangan yang kelihatan mudah,” kata pengasas bersama AdBlock Till Faida, seorang pelabur dan penasihat kepada POMA AI. “Mereka mengejar lapisan penelanan, yang merupakan bahagian saluran paip yang semua orang anggap sebagai masalah yang telah diselesaikan. Penanda aras ini menunjukkan ia tidak. Pengurangan 77% token mengubah ekonomi menjalankan RAG pada skala perusahaan. Itulah jenis kelebihan struktur yang kami cari.”

TENTANG POMA AI: POMA AI ialah sebuah syarikat kepintaran dokumen berpangkalan di Berlin yang membina infrastruktur untuk sistem RAG perusahaan. Teknologi terasnya mengubah dokumen kompleks kepada bahagian yang koheren secara semantik sedia untuk carian vektor dan penggunaan LLM. API POMA memproses dokumen dalam satu panggilan dan mengeluarkan kedua-dua bahagian granular dan set bahagian berkumpulan, serasi dengan mana-mana model penanaman dan stor vektor. Demo percuma tersedia di laman web POMA AI. Maklumat tambahan tentang POMA AI boleh didapati di LinkedIn atau X (Twitter).

POMA AI Achieves Best-in-Class RAG Chunking and Document Ingestion With 77% Token Reduction vs. Conventional Models

Penanaman sedar-struktur POMA PrimeCut menunjukkan peningkatan 119x berbanding penanaman hanya-konteks.

Pertanyaan Media

Florian Athens
fa [at] poma-ai.com
https://poma-ai.com

Artikel ini disediakan oleh pembekal kandungan pihak ketiga. SeaPRwire (https://www.seaprwire.com/) tidak memberi sebarang waranti atau perwakilan berkaitan dengannya.

Sektor: Top Story, Berita Harian

SeaPRwire menyampaikan edaran siaran akhbar secara masa nyata untuk syarikat dan institusi, mencapai lebih daripada 6,500 kedai media, 86,000 penyunting dan wartawan, dan 3.5 juta desktop profesional di seluruh 90 negara. SeaPRwire menyokong pengedaran siaran akhbar dalam bahasa Inggeris, Korea, Jepun, Arab, Cina Ringkas, Cina Tradisional, Vietnam, Thai, Indonesia, Melayu, Jerman, Rusia, Perancis, Sepanyol, Portugis dan bahasa-bahasa lain.