N-gram là gì

Model probabilistik N-gram, merupakan Model yang digunakan untuk mempredikmê say kata berikutnya yang mungkin dari kata N-1 sebelumnya. Model statistika dari uruchảy kata ini seringkali disebut juga sebasợi Model bahasa (language models / LMs).

Bạn đang xem: N-gram là gì

Model estimađê mê seperti N-gram memberikan probabilitas kemungkinan padomain authority kata berikutnya yang mungkin dapat digunakan untuk melakukan kemungkinan penggabungan padomain authority keseluruhan kalimat. Model N-gram merupakan mã sản phẩm yang paling penting dalam pemrosesan suara ataupun bahasa baik untuk memperkirakan probabilitas kata berikutnya maupun keseluruhan sequence.

N-gram cukup esensial pada banyak hal dimana kata perlu diartikan dengan lebih tepat mengingat terkadang ada input yang ambigu maupun gangguan (noise). Misalnya padomain authority speech recognition, seringkali pembicaraan terdengar sangat membingungkan dan banyak kata terdengar sangat mirip sehingga sulit dibedakan.

Selain itu, Mã Sản Phẩm N-gram juga esensial dalam mesin penerjemah statistik misalnya dalam hal menerjemahkan sumber kalimat bahasa Mandarin seperti “他向记者介绍了该声明的主要内容”. Katakanlah telah disiapkan beberapage authority terjemahan bahasa Inggris yang mungkin untuk kalimat tersebut:

he briefed to lớn reporters on the chief contents of the statementhe briefed reporters on the chief contents of the statementhe briefed khổng lồ reporters on the main contents of the statementhe briefed reporters on the main contents of the statement

Gramatikal pada N-gram akan memberikan saran bahwa briefed reporters lebih mungkin dibandingkan dengan briefed lớn reporters, dan main contents lebih mungkin dibandingkan dengan chief contents. Sehingga kita dapat memilih kalimat yang lebih sesuai sebasợi kalimat terjemahan, yakni yang memiliki probabilitas paling tinggi.

Xem thêm: Giấy Ủy Nhiệm Chi Là Gì - Tất Cả Các Thông Tin Về Unc Bạn Nên Biết

Dalam perbaikan ejaan, kita perlu menemukan dan memperbaiki kesalahan eja yang tanpage authority disengaja menghasilkan sebuah kata lain dalam bahasa Inggris. Misalkan kita ingin menulis minutes namun tertulis minuets dalam kalimat yang berbunyi “They are leaving in about fifteen minuets to lớn go to her house.

Oleh karemãng cầu kesalahan ini menjadi sebuah kata lain yang terdaftar dalam bahasa Inggris, kata tersebut tidak akan dapat begitu saja ditandẻo jika hanya dilakukan pengecekan kata yang terdaftar dalam kamus. Namun, bisa diperhatikan bahwa about fifteen minutes akan lebih mungkin dibandingkan dengan about fifteen minuets. Sebuah spellchecker dapat menggunakan estimamê man probabilistik dalam mendetekmê man baik kesalahan maupun menyarankan perbaikan yang memiliki probabilitas lebih tinggi.

Di simê man lain, predikyêu thích kata juga penting dalam sistem argumentative communication yang digunakan untuk membantu para penyandang cacat.

Xem thêm: Ôn Thi Chuyên Ngữ Ở Đâu - Trung Tâm Đào Tạo Giáo Dục Chí Thành

Bagi orang-orang yang tidak dapat berkomunikađam mê menggunakan suara ataupun bahasa isyarat, dapat berkomunikaham mê menggunakan sedikit pergerakan tubuh untuk memilih kata dari thực đơn yang disuarakan oleh sistem. Predikđắm say kata dapat kemudian digunakan untuk menyarankan kata yang mungkin bagi menu tersebut.

Selain area-area sederhana yang telah didiskusikan di atas, model N-gram juga memegang peranan amat penting dalam NLP, seperti part-of-speech tagging, natural language generation, dan word similarity, juga untuk aplikađê mê authorship identification, sentiment extraction hing


*

Dr. Derwin Suhartono, S.Kom., M.T.I Head of Program of Computer Science | School of Computer Science

Chuyên mục: Hỏi Đáp