9 Cara Search Engine Mengaplikasikan Machine Learning

Para raksasa teknologi banyak berinvestasi dalam machine learning.

Pada 2019, Microsoft berinvestasi di 11 startup artificial intelligence (AI), dengan $1 miliar untuk OpenAI saja. Dan mereka bahkan bukan sumber modal ventura perusahaan terbesar yang membanjiri startup AI.

Pada tahun yang sama, Intel Capital melakukan 19 investasi, dan Google Ventures melakukan 16 investasi.

Masuknya modal yang besar itu berarti bahwa kekuatan komputasi AI membuat kemajuan pesat di berbagai sektor mulai dari perawatan kesehatan hingga konstruksi hingga pemasaran dan pengoptimalan mesin telusur.

Mengenal Teknologi Machine Learning

Namun, sebelum kita masuk ke implikasi machine learning dalam alur kerja Search Engine Optimization kita, mari kita definisikan apa yang kita maksud dengan AI.

Ada 3 jenis AI:

  • Narrow AI atau Lemah: Jenis AI ini dirancang untuk melakukan tugas khusus yang harus “diajarkan” ke algoritme (pikirkan algoritme penelusuran Google). Meskipun cakupannya sangat terspesialisasi, AI narrow (ANI) mampu dengan cepat mengenali pola dan melakukan tugas dengan cara yang melampaui kemampuan manusia.
  • General AI atau Kuat: Mampu mempelajari dan memecahkan masalah secara mandiri, AI general (AGI) membawa machine learning ke tingkat berikutnya. AI ini didukung oleh proses pembelajaran mendalam yang dirancang untuk mencerminkan jaringan saraf otak manusia, memungkinkan algoritme membuat keputusan tanpa instruksi.
  • Artificial Superintelligence: Saat ini, artificial superintelligence (ASI) masih sepenuhnya masuk dalam kategori fiksi ilmiah. Jenis AI ini, secara teoritis, akan mampu mengungguli kemampuan manusia untuk memecahkan masalah “tidak terpecahkan” di zaman kita.

Sementara perusahaan seperti OpenAI dan Conversion.ai bergerak menuju pengembangan AI umum untuk pemrosesan bahasa alami, saat ini tidak ada contoh AGI yang jelas.

Untuk maju dari ANI ke AGI, pembelajaran mendalam akan menjadi kunci untuk menciptakan AI yang lebih kuat yang mampu menggunakan penalaran deduktif untuk menganalisis data yang kompleks dan tidak terstruktur, serta membuat keputusan independen.

Kembali pada tahun 2016, Google menyatakan niatnya untuk menjadi perusahaan “machine learning first”. Sejak itu, mereka membuat langkah mantap menuju tujuan itu, meluncurkan Google AI pada 2017 dan meluncurkan BERT pada 2019.

Apa tujuan mereka dalam menggunakan machine learning secara menyeluruh?

Menurut Google, mereka tidak hanya ingin membuat hidup kita lebih mudah, tetapi juga menggunakan AI untuk menemukan “cara baru dalam melihat masalah yang ada, mulai dari memikirkan kembali perawatan kesehatan hingga memajukan penemuan ilmiah.”

Selain tujuan mulia untuk masa depan, umat manusia telah melihat kemajuan machine learning ini dalam skala yang lebih kecil dalam sesuatu yang kita berinteraksi setiap hari – algoritme mesin telusur.

9 Cara Mesin Pencari Mengaplikasikan Machine Learning

Google telah membuat kemajuan yang stabil dalam cara menghubungkan pengguna ke konten yang mereka cari, termasuk sembilan cara yang kami ketahui bahwa mesin telusur menggunakan machine learning saat ini.

1. Deteksi Pola

Mesin telusur menggunakan machine learning untuk mendeteksi pola yang membantu mengidentifikasi spam atau konten duplikat.

Konten berkualitas rendah biasanya memiliki kesamaan yang berbeda, seperti:

  • Kehadiran beberapa tautan keluar ke halaman yang tidak terkait.
  • Banyak sekali penggunaan stopword atau sinonim.
  • Tingkat kemunculan kata kunci “spam” yang teridentifikasi.

Machine learning mengenali pola ini dan menandainya. Ini juga menggunakan data dari interaksi pengguna untuk mendeteksi kapan struktur dan teknik spam baru digunakan, mengenali pola baru, dan juga berhasil menandainya.

Meskipun Google masih menggunakan penilai kualitas manusia, memanfaatkannya untuk mendeteksi pola-pola ini secara drastis mengurangi jumlah tenaga kerja yang diperlukan untuk meninjau konten.

Dengan cara ini, Google dapat secara otomatis menyaring halaman untuk menyingkirkan konten berkualitas rendah sebelum manusia yang sebenarnya harus terlibat.

Pembelajaran mesin adalah teknologi yang terus berkembang, sehingga semakin banyak halaman yang dianalisis, semakin akurat (setidaknya secara teori).

2. Identifikasi Signal Baru

RankBrain adalah algoritme pembelajaran mesin yang dikembangkan oleh Google yang tidak hanya membantu mengidentifikasi pola dalam kueri, tetapi juga membantu mesin telusur mengidentifikasi kemungkinan sinyal peringkat baru.

Sebelum RankBrain, algoritma Google dikodekan sepenuhnya dengan tangan. Itu bergantung pada tim insinyur untuk menganalisis hasil kueri penelusuran, menjalankan tes untuk meningkatkan kualitas hasil tersebut, dan menerapkan perubahan.

Sekarang, sementara masih ada insinyur manusia yang mengerjakan algoritme, RankBrain diam-diam bekerja di latar belakang menjalankan tes dan mengukur bagaimana perubahan memengaruhi interaksi pengguna.

RankBrain memecahkan beberapa masalah rumit yang biasa dihadapi Google dengan algoritme tradisional – termasuk cara menangani istilah penelusuran yang belum pernah dimasukkan ke Google.

Menurut Gary Illyes dari Google dalam Reddit AMA 2019:

“RankBrain adalah komponen peringkat pembelajaran mesin seksi PR yang menggunakan data pencarian historis untuk memprediksi apa yang akan dilakukan pengguna[sic] kemungkinan besar klik untuk kueri yang sebelumnya tidak terlihat.”

Karena mesin telusur dapat mengajarkan teknologi cara menjalankan prediksi dan data sendiri, tenaga kerja manual dapat dikurangi dan karyawan dapat beralih ke hal-hal lain yang tidak dapat dilakukan mesin, seperti inovasi atau proyek yang berpusat pada manusia.

3. Machine Learning Masih Dipakai sebagai Porsi Kecil

Namun, meskipun pembelajaran mesin secara perlahan mengubah cara mesin telusur menemukan dan memberi peringkat situs web, itu tidak berarti itu memiliki dampak besar dan signifikan (saat ini) pada SERP kami.

Dalam diskusi Webmaster Central Office Hours 2019, John Mueller dari Google merujuk bagaimana pembelajaran mesin membantu para insinyur Google lebih memahami berbagai masalah, tetapi dia berhati-hati untuk mencatat bahwa:

“… pembelajaran mesin bukan hanya satu kotak hitam ini yang melakukan segalanya untuk Anda di mana Anda memasukkan internet di satu sisi dan sisi lain mengeluarkan hasil pencarian.”

Dalam sebuah diskusi May 2021 Office Hours, dia menjelaskan bahwa pembelajaran mesin dapat menyesuaikan bobot berbagai sinyal peringkat. Tetapi sekali lagi, masih ada orang yang secara manual memeriksa dan menyesuaikan nilai-nilai itu.

Tujuan akhir Google adalah menggunakan teknologi untuk memberikan pengalaman yang lebih baik kepada pengguna. Mereka tidak ingin mengotomatiskan seluruh proses jika itu berarti pengguna tidak akan memiliki pengalaman yang mereka cari.

Jadi jangan berasumsi bahwa pembelajaran mesin akan segera mengambil alih semua peringkat pencarian; itu hanyalah sebagian kecil dari teka-teki yang telah diterapkan oleh mesin pencari untuk memudahkan hidup kita.

4. Custom Signal Berdasarkan Query Spesifik

Kebijakan privasi Google saat ini membahas bagaimana mesin pencari saat ini membuat hasil pencarian yang dipersonalisasi berdasarkan perilaku pengguna.

Paten pencarian pribadi Google, US20050102282A1, menyatakan bahwa:

“…pencarian yang dipersonalisasi menghasilkan hasil pencarian yang berbeda untuk pengguna mesin pencari yang berbeda berdasarkan minat dan perilaku mereka di masa lalu.”

Kita dapat dengan jelas melihat ini dalam tindakan. Sering digunakan dalam presentasi konferensi, membuktikan proses ini semudah mengetikkan serangkaian kueri ke Google sekaligus dan melihat bagaimana hasilnya berubah tergantung pada apa yang terakhir kita cari.

Riwayat penelusuran hanyalah salah satu komponen dari pengalaman penelusuran yang digunakan pembelajaran mesin untuk memberikan hasil yang lebih baik.

5. Natural Languange Processing

Penting bagi mesin pencari untuk dapat mengenali seberapa mirip satu bagian teks dengan bagian lainnya. Ini berlaku tidak hanya untuk kata-kata yang digunakan tetapi juga maknanya yang lebih dalam.

Bidirectional Encoder Representations from Transformers, singkatnya BERT, adalah kerangka kerja pemrosesan pembelajaran alami yang digunakan Google untuk lebih memahami konteks kueri penelusuran pengguna.

Orang tidak selalu berbicara seperti yang diharapkan mesin. Kami bermain dengan bahasa untuk menghasilkan pergantian frase baru.

Kami menggunakan kata yang sama untuk menggambarkan hal yang berbeda. Terkadang, kita bahkan sengaja dibuat ambigu.

Namun, karena semakin banyak orang yang menggunakan dan menelusuri frasa baru secara online, pembelajaran mesin dapat menampilkan informasi yang lebih akurat untuk kueri tersebut.

Google Trends adalah contoh yang bagus untuk ini. Frasa atau kata baru yang mendapatkan daya tarik (misalnya, “bersinar” atau “tumpah teh”) mungkin memiliki hasil pencarian yang tidak masuk akal pada awalnya.

BERT dirancang untuk mereplikasi pengenalan manusia sedekat mungkin untuk memecahkan kode nuansa kontekstual tersebut dengan mempelajari bagaimana pengguna berinteraksi dengan konten dan mencocokkan kueri penelusuran dengan hasil yang lebih relevan.

Saat bahasa berkembang dan berubah, mesin lebih mampu memprediksi makna kita di balik kata-kata yang kita ucapkan dan memberi kita informasi yang lebih baik.

6. Pencarian Gambar untuk Memahami Foto

Setiap detik, sekitar 1087 foto diunggah ke Instagram, dan 4000 diunggah ke Facebook. Itu berarti ratusan juta foto diunggah ke dua jejaring sosial itu saja setiap hari.

Menganalisis dan membuat katalog bahwa banyak kiriman akan menjadi tugas yang sulit (jika bukan tidak mungkin) bagi manusia, tetapi ini sempurna untuk pembelajaran mesin.

Pembelajaran mesin menganalisis pola warna dan bentuk dan memasangkannya dengan data skema yang ada tentang foto untuk membantu mesin telusur memahami apa sebenarnya gambar itu.

Beginilah cara Google dapato tidak hanya membuat katalog gambar untuk hasil pencarian Gambar Google tetapi juga mendukung pencarian gambar terbalik, yang memungkinkan pengguna untuk mencari menggunakan gambar, bukan kueri teks.

Pengguna kemudian dapat menemukan contoh lain dari foto tersebut secara online, serta foto serupa yang memiliki subjek atau palet warna yang sama dan informasi tentang subjek dalam foto.

Pada gilirannya, cara pengguna berinteraksi dengan hasil ini dapat membentuk SERP mereka di masa mendatang.

7. Peningkatan Kualitas & Penargetan Iklan

Sama seperti hasil pencarian organiknya, Google ingin memberikan iklan yang paling relevan untuk masing-masing pengguna. Menurut paten Google A.S. US20070156887 dan US9773256 tentang kualitas iklan, pembelajaran mesin dapat digunakan untuk meningkatkan “model statistik yang lemah”.

Artinya Peringkat Iklan dapat dipengaruhi oleh sistem pembelajaran mesin.

“Jumlah tawaran, kualitas iklan waktu lelang Anda (termasuk rasio klik-tayang yang diharapkan, relevansi iklan, dan pengalaman laman landas), ambang Peringkat Iklan, konteks penelusuran orang” dimasukkan ke dalam sistem berdasarkan kata kunci demi kata , untuk menentukan ambang batas yang dipertimbangkan oleh Google untuk setiap kata kunci.

8. Identifikasi Sinonim

Saat Anda melihat hasil pencarian yang tidak menyertakan kata kunci dalam cuplikan, kemungkinan karena Google menggunakan RankBrain untuk mengidentifikasi sinonim.

Saat mencari [pelestarian hutan], kamu akan melihat berbagai hasil dengan kata “perlindungan” karena dapat digunakan secara bergantian dengan “pelestarian” dalam kasus ini.

Google bahkan menyoroti sinonim dalam beberapa kasus, lebih lanjut menunjukkan bahwa itu mengenali sinonim.

9. Klarifikasi Query

Salah satu subjek favorit saya adalah maksud pengguna permintaan pencarian.

Ada banyak alasan untuk menjalankan mesin pencari. Pengguna mungkin mencari untuk membeli (transaksional), penelitian (informasi), atau menemukan sumber daya (navigasi) untuk pencarian tertentu.

Selanjutnya, satu kata kunci dapat berguna untuk salah satu atau salah satu dari maksud ini.

Dengan menganalisis pola klik dan jenis konten yang melibatkan pengguna (misalnya, RKT menurut jenis konten), mesin telusur dapat memanfaatkan pembelajaran mesin untuk menentukan maksud di balik penelusuran pengguna.

Contohnya dapat dilihat dengan kueri “perguruan tinggi terbaik” dalam pencarian Google.

Google SERP untuk kata kunci perguruan tinggi terbaik.

Hasilnya adalah ulasan dan daftar perguruan tinggi semua dalam satu SERP, dengan universitas terdaftar di urutan teratas. Ini menunjukkan pemahaman Google tentang kemungkinan maksud di balik pencarian.

Ini mengubah cara SEO melihat struktur dan penempatan tautan karena algoritme Google menggunakan alat seperti BERT untuk menjadi lebih baik dan lebih baik dalam mengevaluasi konteks di mana tautan tersebut ditempatkan.
Ringkasan

Meskipun pembelajaran mesin tidak (dan mungkin tidak akan pernah) sempurna, semakin banyak manusia berinteraksi dengannya, semakin akurat dan “pintar” yang didapat.

Ini bisa mengkhawatirkan bagi sebagian orang, menciptakan visi Skynet dari film “Terminator”.

Namun, hasil sebenarnya mungkin berupa pengalaman yang lebih baik dengan teknologi yang memecahkan masalah kompleks dan memungkinkan manusia untuk fokus dalam mendorong kreativitas dan inovasi.

Pada tahun 2018, Pew Research melakukan jajak pendapat di mana 63% responden mengatakan bahwa mereka berharap untuk masa depan umat manusia yang berkaitan dengan AI – setuju bahwa pada tahun 2030, manusia akan lebih baik dengan bantuan kecerdasan buatan.

Salah satu cara kita telah melihat peningkatan kualitas hidup adalah dengan penelusuran. Saat Google dan mesin telusur lainnya merevolusi machine learning, kita dapat dengan lebih mudah menemukan informasi dan layanan yang kami butuhkan, saat kita membutuhkannya.

*

Referensi:

Tinggalkan komentar