Saturday 2 June 2018

Teknologi Pencarian

Teknologi Pencarian - Masing-masing dari kita telah dihadapkan dengan masalah pencarian informasi lebih dari sekali. Terlepas dari sumber data yang kita gunakan (Internet, sistem file pada hard drive kita, basis data atau sistem informasi global dari perusahaan besar) masalah dapat berlipat ganda dan termasuk volume fisik dari basis data yang dicari, informasi yang tidak terstruktur , jenis file yang berbeda dan juga kerumitan kata-kata pencarian yang akurat. Kami telah mencapai tahap ketika jumlah data pada satu PC tunggal sebanding dengan jumlah data teks yang disimpan di perpustakaan yang tepat. Dan untuk arus data yang tidak terstruktur, di masa depan mereka hanya akan meningkat, dan pada tempo yang sangat cepat. Jika untuk pengguna rata-rata ini mungkin hanya kemalangan kecil, karena tidak ada kontrol perusahaan besar atas informasi dapat berarti masalah yang signifikan. Jadi perlunya menciptakan sistem pencarian dan teknologi yang menyederhanakan dan mempercepat akses ke informasi yang diperlukan, berasal dari masa lalu. Sistem semacam itu banyak dan lebih dari itu, tidak semua dari mereka didasarkan pada teknologi yang unik. Dan tugas memilih yang benar tergantung langsung pada tugas-tugas khusus yang harus diselesaikan di masa depan. Sementara permintaan untuk pencarian data yang sempurna dan alat-alat pengolahan terus berkembang, mari kita mempertimbangkan keadaan dengan sisi penawaran.







Tidak masuk ke dalam berbagai kekhasan teknologi, semua program dan sistem pencarian dapat dibagi menjadi tiga kelompok. Ini adalah: sistem Internet global, solusi bisnis turnkey (pencarian data perusahaan dan teknologi pemrosesan) dan  judi poker online pencarian file atau phrasal sederhana di komputer lokal. Arah yang berbeda mungkin berarti solusi yang berbeda.

Pencarian lokal

Semuanya jelas tentang pencarian di PC lokal. Tidaklah luar biasa untuk fitur-fitur fungsi tertentu yang diterima untuk pilihan jenis file (media, teks, dll.) Dan tujuan pencarian. Cukup masukkan nama file yang dicari (atau bagian dari teks, misalnya dalam format Word) dan hanya itu. Kecepatan dan hasil bergantung sepenuhnya pada teks yang dimasukkan ke dalam baris permintaan. Tidak ada intelektualitas dalam hal ini: hanya melihat melalui file yang tersedia untuk menentukan relevansinya. Hal ini dapat dimengerti: apa gunanya menciptakan sistem yang canggih untuk kebutuhan yang tidak rumit.

Teknologi pencarian global

Masalah sangat berbeda dengan sistem pencarian yang beroperasi di jaringan global. Kita tidak bisa hanya mengandalkan melihat data yang tersedia. Volume besar (Yandex misalnya dapat membanggakan kapasitas pengindeksan lebih dari 11 terabyte data) dari kekacauan global informasi tidak terstruktur akan membuat pencarian sederhana tidak hanya tidak efektif tetapi juga lama dan memakan tenaga kerja. Itulah mengapa belakangan ini fokus telah bergeser ke arah mengoptimalkan dan meningkatkan karakteristik kualitas pencarian. Tetapi skema ini masih sangat sederhana (kecuali untuk inovasi rahasia dari setiap sistem yang terpisah) - pencarian phrasal melalui basis data yang diindeks dengan pertimbangan yang tepat untuk morfologi dan sinonim. Tidak diragukan lagi, pendekatan semacam itu berhasil tetapi tidak menyelesaikan masalah sepenuhnya. Membaca lusinan berbagai artikel yang didedikasikan untuk meningkatkan penelusuran dengan bantuan Google atau Yandex, seseorang dapat mendorong pada kesimpulan bahwa tanpa mengetahui peluang tersembunyi dari sistem ini menemukan dokumen yang relevan dengan kueri adalah masalah lebih dari satu menit, dan terkadang lebih dari satu jam. Masalahnya adalah bahwa realisasi pencarian semacam itu sangat bergantung pada kata atau frasa permintaan, yang dimasukkan oleh pengguna. Semakin tidak jelas kueri, semakin buruk pencariannya. Ini telah menjadi aksioma, atau dogma, yang mana saja yang Anda inginkan.