Teks Speechz ke ucapan
Sintesis pertuturan adalah penghasilan tiruan ucapan manusia. Sistem komputer yang digunakan untuk tujuan ini dipanggil pensintesis pertuturan, dan boleh dilaksanakan dalam perisian atau produk perkakasan. Sistem teks ke pertuturan (TTS) menukar teks bahasa biasa ke dalam ucapan; sistem lain memberikan perwakilan bahasa simbolik seperti transkripsi telefon ke dalam ucapan. [1] Pertuturan yang disintesis boleh dicipta dengan kepingan pertuturan yang dirakam yang disimpan dalam pangkalan data. Sistem berbeza dalam saiz unit pertuturan yang disimpan; sistem yang menyimpan telefon atau diphone menyediakan julat output terbesar, tetapi mungkin kekurangan kejelasan. Untuk domain penggunaan tertentu, penyimpanan keseluruhan perkataan atau ayat membolehkan output berkualiti tinggi. Sebagai alternatif, pensintesis boleh menggabungkan model saluran vokal dan ciri-ciri suara manusia lain untuk mewujudkan output suara "sintetik" sepenuhnya. [2] Kualiti pensintesis ucapan diadili oleh persamaannya dengan suara manusia dan oleh keupayaannya untuk difahami. Program teks ke pertuturan yang bijak membolehkan orang kurang upaya penglihatan atau membaca untuk mendengar karya bertulis pada komputer rumah. Banyak sistem operasi komputer telah termasuk pensintesis pertuturan sejak awal 1990-an.
Gambaran keseluruhan sistem TTS biasa
Pengumuman automatik MENU0:00 Suara sintetik mengumumkan kereta api yang tiba di Sweden. Masalah memainkan fail ini? Lihat bantuan media.
Contoh Microsoft Sam MENU0:00 Suara pensintesis ucapan lalai Microsoft Windows XP mengatakan "Musang coklat cepat melompat ke atas anjing malas 1,234,567,890 kali. soi" Masalah memainkan fail ini? Lihat bantuan media. Sistem teks ke pertuturan (atau "enjin") terdiri daripada dua bahagian:[3] bahagian depan dan belakang. Bahagian hadapan mempunyai dua tugas utama. Pertama, ia menukar teks mentah yang mengandungi simbol seperti nombor dan singkatan ke dalam bersamaan dengan kata-kata bertulis. Proses ini sering dipanggil normalisasi teks, pra-pemprosesan, atau tokenisasi. Bahagian depan kemudian memperuntukkan transkripsi fotografi kepada setiap perkataan, dan membahagikan dan menandakan teks ke dalam unit prosodik, seperti frasa, klausa, dan ayat. Proses memperuntukkan transkripsi phonetik kepada perkataan dipanggil penukaran teks ke telefon atau grafem-ke-telefon. Transkripsi fobitik dan maklumat prosody bersama-sama membentuk perwakilan linguistik simbolik yang dihasilkan oleh bahagian depan. Back-end—sering dirujuk sebagai pensintesis & mdash;kemudian menukar perwakilan linguistik simbolik ke bunyi. Dalam sistem tertentu, bahagian ini termasuk pengiraan prosody sasaran (kontur padang, tempoh telefon),[4] yang kemudiannya dikenakan ke atas ucapan output.
sejarah versi
- Versi 1.0 diposkan pada 2013-10-06
Butiran Atur Cara
- Kategori: Audio & Multimedia > Pemain Fail Audio
- Penerbit: Phelipe Maia
- Lesen: Percuma
- Harga: N/A
- Versi: 1.0
- Platform: android