
IndoBERT-BiLSTM-CRF: Indonesian Biomedical Named Entity Recognition
Model Named Entity Recognition (NER) untuk teks medis dan biomedis berbahasa Indonesia. Model ini menggunakan arsitektur IndoBERT-BiLSTM-CRF yang telah dilatih pada korpus DetikHealth untuk mengidentifikasi entitas spesifik seperti Penyakit (Disease), Gejala (Symptom), dan Obat (Drug).
Tech Stack
Pengenalan Entitas Bernama atau Named Entity Recognition (NER) sangat penting untuk menyusun informasi dari teks medis, seperti mengidentifikasi penyakit, gejala, dan obat-obatan. Namun, penelitian terkait NER medis berbahasa Indonesia masih terbatas karena kurangnya korpus beranotasi dan sumber daya linguistik.
Model ini dikembangkan untuk mengatasi masalah tersebut dengan menggunakan representasi kata kontekstual yang kuat. Melalui pengujian berbagai arsitektur, model IndoBERT-BiLSTM-CRF terbukti memberikan performa terbaik dalam memahami semantik teks biomedis Indonesia dan menjaga konsistensi batas entitas (*boundary consistency*).
