Arch adalah sambungan sumber terbuka Apache Nutch (enjin carian tujuan umum yang popular dan sangat berskala) untuk carian intranet. Tidak gembira dengan enjin carian korporat anda? Tidak menghairankan, sangat sedikit orang. Untuk pengetahuan kami yang terbaik, tiada enjin intranet yang berfungsi serta carian Web global Google. Terdapat sebab asas untuk ini: algoritma yang digunakan oleh Google di Web global (atau serupa) tidak berfungsi hampir serta pada intranet untuk kekurangan data statistik. Gerbang (akhirnya!) menyelesaikan masalah ini. Ia menggunakan kaedah novel untuk menyampaikan hasil carian ketepatan tinggi yang berfungsi dengan baik. Jangan percaya? Alat penilaian ujian buta disertakan. Anda boleh menggunakan Arch dan membandingkan prestasinya dengan enjin carian semasa anda dan/atau Google (di bahagian awam laman web anda) menggunakan metodologi ujian buta. Sebagai tambahan kepada kualiti carian yang sangat baik, Arch mempunyai banyak ciri kritikal untuk persekitaran korporat: - Keselamatan tahap dokumen. Pengguna hanya boleh mencari dokumen yang dibenarkan untuk dilihat. - Kemas kini indeks yang murah. Gerbang mampu mengekalkan indeks terkini dan mengelakkan laman web lengkap yang kerap mengkasihi. - 24/7 ketersediaan. Selalu ada indeks kerja yang ada, walaupun merangkak gagal. - Sokongan untuk pengindeksan serentak dan carian beberapa laman web, dengan keupayaan untuk mencari dan mentadbir mana-mana laman web secara berasingan, jika diperlukan. Penambahan dinamik dan penyingkiran laman web adalah mudah. - Direktori tapak yang dijana secara automatik. - Sokongan kos rendah sekali dikerahkan. - Dwi antara muka (PHP dan Jawa) untuk penggunaan dan penyesuaian yang mudah. - & Sebut harga carian bersemuka;daripada kotak & sebut harga;. - Satu set penghuraian yang luas dan boleh diperluas untuk menghuraikan pelbagai format fail: HTML, PHP, PDF, Ms Office, Open Office, dll. - Seni bina berasaskan modular, berasaskan plugin yang boleh disesuaikan dengan mudah dan diperluaskan. - Kod sumber dimasukkan. - Prestasi tinggi dan skalabiliti. Gerbang boleh berjalan pada kelompok komputer untuk mengindeks set data yang sangat besar.
sejarah versi
- Versi 1.15 diposkan pada 2019-05-17
Di pelabuhan pada Nutch 1.15 - Versi 1.9.2 diposkan pada 2016-08-18
Penghuraian dokumen yang lebih baik, ditadar pada Nutch 1.9. - Versi 1.2 diposkan pada 2010-09-17
Di ported ke Apache Nutch 1.2, menaik taraf parser PDF, menambah alat ujian dan penalaan, menyelesaikan isu-isu yang terdapat dalam versi beta, membolehkan penggunaan kluster komputer.
Butiran Atur Cara
- Kategori: Rangkaian & Internet > Alatan Gelintar/Carian
- Penerbit: CSIRO Astronomy and Space Science
- Lesen: Percuma
- Harga: N/A
- Versi: 1.15
- Platform: windows