wikipedia2XML 0.1

Lesen: Percuma ‎Saiz fail: N/A
‎Penarafan Pengguna: 3.0/5 - ‎1 ‎Undi

Koleksi skrip python untuk mencipta dan mengendalikan korpus XML (koleksi teks yang besar untuk tujuan linguistik) dari longgokan sandaran pangkalan data Wikipedia asal. Ia termasuk penghurai berasaskan ungkapan biasa untuk bahasa penanda MediaWiki.

sejarah versi

  • Versi 0.1 diposkan pada 2008-04-01
    Beberapa pembaikan dan pengemaskinian
  • Versi 0.1 diposkan pada 2008-04-01

Butiran Atur Cara