Web mesin pencari

Dari Wikipedia, ensiklopedia bebas

Sebuah mesin pencari web adalah sistem perangkat lunak yang dirancang untuk mencari informasi di World Wide Web. Hasil pencarian umumnya disajikan dalam garis hasil sering disebut sebagai halaman hasil mesin pencari (SERPs). Informasi mungkin campuran halaman web, gambar, dan jenis file lainnya. Beberapa mesin pencari juga tambang data yang tersedia dalam database atau direktori terbuka. Tidak seperti direktori web, yang diselenggarakan hanya oleh editor manusia, mesin pencari juga menjaga informasi real-time dengan menjalankan algoritma pada web crawler.

Sejarah Mesin Pencari

Selama pengembangan awal dari web, ada daftar webservers diedit oleh Tim Berners-Lee dan host pada webserver CERN. Satu snapshot sejarah dari daftar tahun 1992 tetap, tetapi karena semakin banyak webservers pergi online daftar sentral tidak bisa lagi mengikuti. Di situs NCSA, server baru diumumkan dengan judul "Apa yang Baru!"

Alat ini pertama digunakan untuk mencari di Internet adalah Archie. Nama singkatan "arsip" tanpa "v". Buku itu diciptakan pada tahun 1990 oleh Alan Emtage, Bill Heelan dan J. Peter Deutsch, mahasiswa ilmu komputer di McGill University di Montreal. Program ini download daftar direktori dari semua file yang terletak di publik anonymous FTP (File Transfer Protocol) situs, menciptakan database dicari nama file; Namun, Archie tidak indeks isi dari situs tersebut karena jumlah data yang sangat terbatas itu bisa dengan mudah dicari secara manual.

Munculnya Gopher (diciptakan pada tahun 1991 oleh Mark McCahill di University of Minnesota) menyebabkan dua program pencarian baru, Veronica dan Jughead. Seperti Archie, mereka mencari nama file dan judul yang disimpan dalam sistem index Gopher. Veronica (Very Easy Rodent-Oriented Net Index-lebar untuk Arsip Komputerisasi) menyediakan pencarian kata kunci dari judul yang paling Gopher menu di seluruh daftar Gopher. Jughead (Jonzy Universal Gopher Hierarchy Penggalian Dan Display) adalah alat untuk memperoleh informasi menu dari server Gopher tertentu. Sementara nama mesin pencari "Archie" bukan referensi ke seri buku komik Archie, "Veronica" dan "Jughead" adalah karakter dalam seri, sehingga referensi pendahulu mereka.

Pada musim panas tahun 1993, tidak ada mesin pencari ada untuk web, meskipun banyak katalog khusus yang dikelola oleh tangan. Oscar Nierstrasz di Universitas Jenewa menulis serangkaian script Perl yang secara berkala cermin halaman ini dan menulis ulang mereka ke dalam format standar. Ini membentuk dasar untuk W3Catalog, pertama mesin pencari primitif Web, yang dirilis pada tanggal 2 September 1993.

Pada Juni 1993, Matthew Gray, kemudian di MIT, menghasilkan apa mungkin robot web pertama, World Wide Web Wanderer Perl berbasis, dan menggunakannya untuk menghasilkan indeks yang disebut 'Wandex'. Tujuan dari Wanderer adalah untuk mengukur ukuran dari World Wide Web, yang hal itu sampai akhir 1995. Kedua Aliweb mesin pencari web muncul pada bulan November 1993. Aliweb tidak menggunakan web robot, tetapi bergantung pada diberitahu oleh website administrator dari keberadaan di setiap lokasi dari file indeks dalam format tertentu.

JumpStation (dibuat pada Desember 1993 oleh Jonathon Fletcher) menggunakan robot web untuk mencari halaman web dan untuk membangun indeks, dan menggunakan formulir web sebagai antarmuka program permintaan tersebut. Karena itu, itu pertama alat sumber daya-penemuan WWW untuk menggabungkan tiga fitur penting dari mesin pencari web (merangkak, pengindeksan, dan mencari) seperti yang dijelaskan di bawah ini. Karena sumber daya terbatas yang tersedia pada platform yang berlari, pengindeksan dan karenanya mencari yang terbatas pada judul dan judul ditemukan di halaman web crawler ditemui.

Salah satu yang pertama "semua teks" mesin pencari berbasis crawler adalah WebCrawler, yang keluar pada tahun 1994. Tidak seperti pendahulunya, itu memungkinkan pengguna untuk mencari setiap kata dalam setiap halaman web, yang telah menjadi standar untuk semua mesin pencari utama sejak saat itu. Itu juga yang pertama dikenal secara luas oleh masyarakat. Juga pada tahun 1994, Lycos (yang dimulai di Carnegie Mellon University) diluncurkan dan menjadi usaha komersial utama.

Segera setelah itu, banyak mesin pencari muncul dan bersaing memperebutkan popularitas. Ini termasuk Magellan, Excite, Infoseek, Inktomi, Northern Light, dan AltaVista. Yahoo! merupakan salah satu cara yang paling populer bagi orang untuk menemukan halaman web yang menarik, tapi fungsi pencarian dioperasikan pada direktori web, daripada salinan teks lengkap atas halaman web. Pencari informasi juga bisa menelusuri direktori bukannya melakukan pencarian berdasarkan kata kunci.

Google mengadopsi ide menjual istilah pencarian pada tahun 1998, dari sebuah perusahaan mesin pencari kecil bernama goto.com. Langkah ini memiliki dampak yang signifikan pada bisnis SE, yang pergi dari berjuang untuk salah satu bisnis yang paling menguntungkan di internet.

Pada tahun 1996, Netscape sedang mencari untuk memberikan mesin pencari tunggal kesepakatan eksklusif sebagai mesin pencari ditampilkan di web browser Netscape. Ada begitu banyak bunga bahwa alih-alih Netscape perjanjian dengan lima dari mesin pencari utama: sebesar $ 5 juta per tahun, masing-masing mesin pencari akan di rotasi pada halaman mesin pencari Netscape. Kelima mesin yang Yahoo!, Magellan, Lycos, Infoseek, dan Excite.

Mesin pencari juga dikenal sebagai beberapa bintang cemerlang dalam investasi frenzy Internet yang terjadi pada akhir 1990-an. Beberapa perusahaan memasuki pasar spektakuler, menerima keuntungan catatan selama penawaran umum perdana mereka. Beberapa telah dibawa turun mesin pencari publiknya, dan hanya memasarkan edisi enterprise-satunya, seperti Northern Light. Banyak perusahaan mesin pencari terperangkap dalam gelembung dot-com, boom pasar spekulasi-driven yang memuncak pada tahun 1999 dan berakhir pada tahun 2001.

Sekitar tahun 2000, mesin pencari Google bangkit untuk menonjol. Perusahaan mencapai hasil yang lebih baik bagi banyak pencarian dengan inovasi bernama PageRank, seperti yang dijelaskan dalam Anatomi Search Engine. Algoritma iteratif Ini peringkat halaman web berdasarkan jumlah dan PageRank dari situs web lain dan halaman yang memiliki pranala sana, pada premis bahwa situs yang diinginkan terkait dengan lebih dari yang lain. Google juga mempertahankan antarmuka minimalis dengan mesin pencari. Sebaliknya, banyak pesaingnya tertanam mesin pencari di portal web. Bahkan, mesin pencari Google menjadi sangat populer sehingga mesin spoof muncul seperti Mystery Seeker.

Pada tahun 2000, Yahoo! telah menyediakan layanan pencarian berdasarkan mesin pencari Inktomi. Yahoo! mengakuisisi Inktomi pada tahun 2002, dan Overture (yang dimiliki AlltheWeb dan Altavista) pada tahun 2003. Yahoo! beralih ke mesin pencari Google sampai tahun 2004, ketika meluncurkan mesin pencari sendiri yang didasarkan pada teknologi gabungan dari rencana akusisi tersebut.

Microsoft pertama kali diluncurkan MSN Search pada musim gugur 1998 menggunakan hasil pencarian dari Inktomi. Pada awal tahun 1999 situs tersebut mulai menampilkan daftar dari Looksmart, dicampur dengan hasil dari Inktomi. Untuk waktu yang singkat pada tahun 1999, MSN Search digunakan hasil dari AltaVista yang sebaliknya. Pada tahun 2004, Microsoft mulai transisi ke teknologi pencarian sendiri, didukung oleh web crawler sendiri (disebut msnbot).

Namanya mesin pencari Microsoft, Bing, diluncurkan pada tanggal 1 Juni 2009. Pada tanggal 29 Juli 2009, Yahoo! dan Microsoft menyelesaikan kesepakatan di mana Yahoo! Pencarian akan didukung oleh teknologi Microsoft Bing.

Bagaimana mesin pencari web bekerja

Sebuah mesin pencari beroperasi dengan urutan sebagai berikut:

Web crawling
Indeksasi
Pencarian dilakukan

Mesin pencari web bekerja dengan menyimpan informasi tentang banyak halaman web, yang mereka mengambil dari markup HTML dari halaman. Halaman ini akan diambil oleh crawler Web (kadang-kadang juga dikenal sebagai laba-laba) - sebuah crawler Web otomatis yang mengikuti setiap link di situs. Pemilik situs dapat mengecualikan halaman tertentu dengan menggunakan robots.txt.

Mesin pencari kemudian menganalisa isi dari setiap halaman untuk menentukan bagaimana harus diindeks (misalnya, kata-kata dapat diambil dari judul, isi halaman, judul, atau field khusus yang disebut meta tag). Data tentang halaman web disimpan dalam sebuah database indeks untuk digunakan dalam pencarian selanjutnya. Sebuah query dari pengguna dapat menjadi satu kata. Indeks membantu mencari informasi yang berkaitan dengan query secepat mungkin. Beberapa mesin pencari, seperti Google, menyimpan semua atau sebagian dari halaman sumber (disebut sebagai cache) maupun informasi tentang halaman web, sedangkan lain, seperti AltaVista, menyimpan setiap kata dari setiap halaman yang mereka temukan. Cache halaman ini selalu memegang pencarian teks yang sebenarnya karena merupakan salah satu yang sebenarnya diindeks, sehingga dapat sangat berguna bila konten dari saat ini halaman telah diperbarui dan istilah pencarian tidak lagi di dalamnya.

Masalah ini mungkin dianggap sebagai bentuk ringan dari linkrot, dan penanganan Google itu meningkatkan kegunaan dengan memenuhi harapan pengguna bahwa istilah pencarian akan berada di halaman web dikembalikan. Ini memenuhi prinsip paling heran, karena pengguna biasanya mengharapkan bahwa istilah pencarian akan berada di halaman kembali. Peningkatan relevansi pencarian membuat halaman-halaman cache sangat berguna karena mereka mungkin berisi data yang mungkin tidak lagi tersedia di tempat lain.

Ketika pengguna memasukkan query ke mesin pencari (biasanya dengan menggunakan kata kunci), mesin memeriksa indeks dan memberikan daftar best-matching halaman web sesuai dengan kriteria, biasanya dengan ringkasan singkat berisi judul dokumen dan kadang-kadang bagian dari teks. Indeks dibangun dari informasi yang tersimpan dengan data dan metode yang informasi diindeks. Sejak tahun 2007 mesin pencari Google.com telah memungkinkan seseorang untuk mencari menurut tanggal dengan mengklik "alat Tampilkan pencarian" di kolom paling kiri dari halaman hasil pencarian awal, dan kemudian memilih rentang tanggal yang diinginkan. Kebanyakan mesin pencari mendukung penggunaan operator boolean AND, OR dan NOT untuk lebih menentukan permintaan pencarian. Operator Boolean adalah untuk pencarian literal yang memungkinkan pengguna untuk memperbaiki dan memperpanjang masa jabatan pencarian. Mesin mencari kata atau frasa persis seperti masuk. Beberapa mesin pencari menyediakan fitur canggih yang disebut pencarian kedekatan, yang memungkinkan pengguna untuk menentukan jarak antara kata kunci. Ada juga pencarian berdasarkan konsep-dimana penelitian melibatkan menggunakan analisis statistik pada halaman yang berisi kata atau frasa yang Anda cari. Selain itu, permintaan bahasa alami memungkinkan pengguna untuk mengetik pertanyaan dalam bentuk yang sama yang akan meminta untuk manusia. Sebuah situs seperti ini akan ask.com.

Kegunaan dari mesin pencari bergantung pada relevansi hasil set memberikan kembali. Meskipun mungkin ada jutaan halaman web yang mengandung suatu kata atau frase, sebagian halaman mungkin lebih relevan, populer, atau autoritatif daripada yang lain. Kebanyakan mesin pencari menggunakan berbagai metode untuk menentukan peringkat hasil untuk memberikan yang "terbaik" hasil pertama. Bagaimana mesin pencari yang memutuskan halaman yang paling cocok, dan apa pesanan hasilnya harus ditunjukkan dalam, sangat bervariasi dari satu mesin ke yang lain. Metode juga berubah seiring waktu dengan berubahnya penggunaan internet dan teknik baru berkembang. Ada dua jenis utama mesin pencari yang telah berevolusi: satu adalah sistem kata kunci standar dan hirarki memerintahkan bahwa manusia telah diprogram secara ekstensif. Yang lainnya adalah sebuah sistem yang menghasilkan "indeks terbalik" dengan menganalisis teks-teks ini menempatkan. Bentuk pertama ini bergantung lebih banyak pada komputer itu sendiri untuk melakukan sebagian besar pekerjaan.

Kebanyakan mesin pencari web adalah usaha komersial yang didukung oleh pendapatan dari iklan dan dengan demikian beberapa dari mereka memungkinkan pengiklan untuk memiliki daftar mereka peringkat tinggi dalam hasil pencarian untuk biaya. Search engine yang tidak menerima uang untuk hasil pencarian mereka menghasilkan uang dengan menjalankan iklan pencarian terkait di samping hasil mesin pencari biasa. Mesin pencari menghasilkan uang setiap kali seseorang mengklik salah satu iklan tersebut.

Pangsa Pasar

Google adalah mesin pencari paling populer di dunia, dengan pangsa pasar dari 68,69 persen. Baidu datang dalam kedua jauh, menjawab pertanyaan 17.17 per cent online.
Mesin pencari paling populer di dunia adalah:

Search engine	Market share in June 2014
Google	68.69%
Baidu	17.17%
Yahoo!	6.74%
Bing	6.22%
Excite	0.22%
Ask	0.13%
AOL	0.13%

Asia Timur dan Rusia

Negara-negara Asia Timur dan Rusia merupakan beberapa tempat di mana Google bukan mesin pencari paling populer. Soso (search engine) lebih populer daripada Google di Cina. Yandex perintah pangsa pasar dari 61,9 persen di Rusia, dibandingkan dengan Google 28,3 persen. Di Cina, Baidu adalah mesin pencari paling populer. Portal pencari homegrown Korea Selatan, Naver, digunakan untuk 70 persen secara online pencarian di negara ini. Yahoo! Jepang dan Yahoo! Taiwan adalah jalan yang paling populer untuk pencarian internet di Jepang dan Taiwan, masing-masing.

Bias mesin pencari

Meskipun mesin pencari diprogram untuk peringkat situs berdasarkan beberapa kombinasi dari popularitas mereka dan relevansi, studi empiris menunjukkan berbagai bias politik, ekonomi, dan sosial dalam informasi yang mereka sediakan. Bias ini bisa menjadi akibat langsung dari ekonomi dan proses komersial (misalnya, perusahaan yang beriklan dengan mesin pencari dapat menjadi juga lebih populer dalam hasil pencarian organik), dan proses politik (misalnya, penghapusan hasil pencarian untuk mematuhi hukum setempat).

Bias juga dapat menjadi hasil dari proses sosial, karena algoritma mesin pencari sering dirancang untuk mengecualikan sudut pandang non-normatif mendukung lebih "populer" Hasil. Algoritma Indexing mesin pencari utama condong menuju cakupan situs berbasis di AS, daripada website dari negara-negara non-AS.

Google Pengeboman adalah salah satu contoh dari upaya untuk memanipulasi hasil pencarian untuk alasan politik, sosial atau komersial.

Hasil disesuaikan dan gelembung penyaring

Banyak mesin pencari seperti Google dan Bing memberikan hasil yang disesuaikan berdasarkan sejarah aktivitas pengguna. Hal ini menyebabkan efek yang telah disebut gelembung filter. Istilah ini menggambarkan sebuah fenomena di mana situs web menggunakan algoritma untuk selektif menebak informasi apa yang pengguna ingin melihat, berdasarkan informasi tentang pengguna (seperti lokasi, klik masa lalu perilaku dan riwayat penelusuran). Akibatnya, website cenderung hanya menampilkan informasi yang setuju dengan sudut pandang masa lalu pengguna, secara efektif mengisolasi pengguna dalam gelembung yang cenderung untuk mengecualikan informasi sebaliknya. Perdana contoh adalah hasil pencarian personalisasi Google dan Facebook pribadi aliran berita. Menurut Eli Pariser, yang menciptakan istilah, pengguna mendapatkan pencahayaan yang lebih sedikit untuk sudut pandang yang bertentangan dan terisolasi intelektual dalam gelembung informasi mereka sendiri. Pariser terkait contoh di mana satu pengguna mencari Google untuk "BP" dan mendapat berita tentang investasi British Petroleum sementara pencari lain mendapat informasi tentang tumpahan minyak Deepwater Horizon dan bahwa halaman dua hasil pencarian yang "sangat berbeda". Efek bubble mungkin memiliki implikasi negatif untuk wacana sipil, menurut Pariser.

Karena masalah ini telah diidentifikasi, bersaing mesin pencari telah muncul yang berusaha untuk menghindari masalah ini dengan tidak melacak atau "gelembung" pengguna.

sumber: http://en.wikipedia.org/wiki/Web_search_engine

My SEO Story

Sunday, 6 July 2014

Mesin Pencari Web