- Apakah data corpus?
- Apa contoh korpus?
- Apakah corpus data dalam penyelidikan?
- Apakah Data Corpus vs Dataset?
Apakah data corpus?
Corpus adalah koleksi teks asli atau audio yang dianjurkan ke dalam dataset. Authentic di sini bermaksud teks bertulis atau audio yang dituturkan oleh bahasa asli atau dialek. Korpus boleh terdiri daripada segala -galanya dari akhbar, novel, resipi, siaran radio ke rancangan televisyen, filem, dan tweet.
Apa contoh korpus?
Contoh korpus umum ialah Korpus Negara British. Sesetengah korpora mengandungi teks yang dicontohi (dipilih dari) pelbagai bahasa tertentu, contohnya, dari dialek tertentu atau dari kawasan subjek tertentu. Corpora ini kadang -kadang dipanggil 'sublanguage corpora'.
Apakah corpus data dalam penyelidikan?
Corpus adalah koleksi teks asli yang disimpan secara elektronik yang boleh digunakan untuk mengetahui maklumat mengenai bahasa yang mungkin tidak dapat diperhatikan melalui intuisi sahaja.
Apakah Data Corpus vs Dataset?
Sebaliknya, dataset muncul dalam setiap domain aplikasi --- koleksi apa-apa jenis data adalah dataset. "Corpus adalah koleksi teks yang besar. Ia adalah badan bahan bertulis atau dituturkan di mana analisis linguistik berdasarkan. "