www.wikidata.id-id.nina.az
Artikel ini sebatang kara artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala Tag ini diberikan pada Oktober 2022 Korpus teks adalah sumber daya bahasa yang terdiri dari kumpulan teks yang besar Pada linguistik korpus teks juga dikenal dengan sebutan jamak korpora yang saat ini biasanya disimpan dan diproses secara elektronik Korpus teks digunakan untuk melakukan analisis statistik serta pengujian hipotesis memeriksa kejadian atau memvalidasi aturan lingustik dalam wilayah bahasa tertentu Definisi lainnya dari korpus teks adalah kumpulan teks alami baik bahasa lisan maupun bahasa tulis yang disusun secara sistematis 1 Daftar isi 1 Sejarah korpus 2 Aplikasi korpus teks 3 Referensi 4 Lihat pulaSejarah korpus SuntingLinguistik korpus yang merupakan pembahasan ilmiah muncul sekitar tahun 1960 an yang pada era tersebut dua buku dari Noam Chomsky berjudul Syntactic Structures terbit pada tahun 1957 dan Aspects of Theory of Syntax terbit pada tahun 1965 memberikan dampak besar bahkan memicu revisi standar paradigma dalam linguistik teoretis 2 Setelah itu muncul proyek proyek mengenai korpus Proyek korpus pertama dimulai di akhir tahun 1950 an Randolph Quirk melakukan pengumpulan data bahasa untuk penelitian tata bahasa secara empiris Saat itu data yang dikumpulkannya belum terkomputerisasi dan baru pada pertengahan tahun 1980 an proses komputerisasi tersebut dilakukan oleh Randolph Quirk bersama Sydney Greenbaum Itulah proyek korpus pertama yang dikenal dengan International Corpus of English yang didalam data tersebut terdiri atas 1 juta kata yang meliputi 500 ribu kata data lisan dan 500 ribu kata data tulis 3 Proyek korpus kedua bernama Brown Corpus disusun oleh Nelson Francis pada tahun 1960 an yang terdiri dari 1 juta kata 4 Proyek ketiga dari korpus bernama English Lexical Studies dimulai pada tahun 1963 di Edinburgh dan diselesaikan di Birmingham dipimpin oleh John Sinclair Proyek ini berbasis sampel teks elektronik bahasa lisan dan tulis yang sangat kecil 5 Pada proyek korpus berikutnya yaitu Collins Cobuild English Language Dictionary yang disusun pertengahan 1970 an dan kamus tersebut diterbitkan pada tahun 1987 dibawah panduan John Sinclair Pada kamus itu korpus tersebut terdiri atas 18 3 juta kata 6 Aplikasi korpus teks SuntingPengaplikasian dari korpus teks ini terdapat pada beberapa area meliputi Aplikasi korpus teks dalam dalam teknologi bahasa pemrosesan bahasa alami dan linguistik komputansiAnalisis dan pemrosesan berbagai jenis korpora merupakan subjek beragam pekerjaan dalam linguistik komputasi pengenalan suara dan terjemahan mesin hal tersebut sering digunakan untuk membuat model Markov tersembunyi yang digunakan untuk penandaan bagian ucapan dan tujuan lainnya Turunan dari daftar korpora serta frekuensi berguna dalam pengajaran bahasa Korpora bisa dianggap sebagai bentuk dari jenis bantuan menulis dan memahami bahasa asing karena dari tata bahasa kontekstualnya pengguna mampu memperoleh bahasa non asli melalui paparan teks yang otentik di korpora sehingga memungkinkan pengguna yang mempelajarinya mampu untuk memahami cara dari pembentukan kalimat dalam bahasa tujuan dan memungkinkan penulisan yang efektif 7 Mesin penerjemahDalam mesin penerjemah algoritma terjemahan mesin untuk menerjemahkan antara dua bahasa sering dilatih menggunakan fragmen paralel yang terdiri atas korpus bahasa pertama serta korpus bahasa kedua yang merupakan hasil terjemahan dari elemen per elemen dari bahasa pertama Dalam korpus terjemahan teks teks dalam satu bahasa merupakan terjemahan dari teks teks dalam bahasa lain Dalam korpus yang sebanding teks teks tersebut memiliki jenis yang sama serta mencakup konten yang sama tetapi mereka bukan merupakan terjemahan satu sama lain 8 Untuk mengeksploitasi teks paralel beberapa jenis perataan teks yang mengidentifikasi segmen teks yang setara frasa atau kalimat merupakan bagian prasyarat untuk analisis bahasa FilologiKorpora teks juga digunakan dalam studi dokumen sejarah seperti dalam upaya untuk menerjemahkan naskah naskah kuno atau digunakan dalam studi pada Alkitab Beberapa korpora arkeologi dapat memiliki durasi yang begitu singkat sehingga mereka memberikan gambaran pada waktunya Salah satu korpora terpendek dalam waktu terdapat pada teks surat Amarna 15 30 tahun 1350 SM Referensi Sunting Budiwiyanto Adi 2022 01 22 Korpus Dalam Penyusunan Kamus Badan Pengembangan dan Pembinaan Bahasa Diakses tanggal 14 Oktober 2022 Verfasser Chomsky Noam 1957 Syntactic Structures Mouton hlm 11 ISBN 978 3 11 231600 9 OCLC 1156931389 Parameter url status yang tidak diketahui akan diabaikan bantuan The International Corpus of English University College London 18 November 2021 Diakses tanggal 15 Oktober 2022 Brown Corpus Manual icame uib no Diakses tanggal 19 Oktober 2022 McHardy Sinclair John 1970 English lexical studies report to OSTI on project C LP 08 Department of English University of Birmingham OCLC 1120811855 Standop Ewald 1988 01 Collins COBUILD English language dictionary System 16 3 384 388 doi 10 1016 0346 251x 88 90082 6 ISSN 0346 251X Periksa nilai tanggal di date bantuan Yoon Hyunsook Hirvela Alan 2004 12 ESL student attitudes toward corpus use in L2 writing Journal of Second Language Writing 13 4 257 283 doi 10 1016 j jslw 2004 06 002 ISSN 1060 3743 Periksa nilai tanggal di date bantuan Wolk Krzysztof Marasek Krzysztof 2014 Rocha Alvaro Correia Ana Maria Tan Felix B Stroetmann Karl A ed Real Time Statistical Speech Translation dalam bahasa Inggris 275 Cham Springer International Publishing hlm 107 113 doi 10 1007 978 3 319 05951 8 11 ISBN 978 3 319 05950 1 Lihat pula SuntingLinguistik korpus Diperoleh dari https id wikipedia org w index php title Korpus teks amp oldid 22487725