МОДИФІКОВАНИЙ АЛГОРИТМ TF-IDF ДЛЯ SEO-ОПТИМІЗАЦІЇ НА ОСНОВІ КОНТЕКСТНОГО АНАЛІЗУ МОДЕЛІ BERT ТА GROQ API

Автор(и)

  • І. Д. Сілін Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» https://orcid.org/0009-0000-7407-4908
  • К. Р. Потапова Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» https://orcid.org/0000-0002-3347-6350
  • М. В. Наливайчук Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» https://orcid.org/0000-0002-8942-9844

Ключові слова:

SEO-оптимізація веб-контенту, статистичні методи, нейромережеві моделі, TF–IDF, BERT-фільтрація, лематизація, генерація заголовків

Анотація

У статті представлено інтегрований підхід до автоматизованої SEO-оптимізації веб-контенту на основі поєднання класичних статистичних методів та сучасних нейромережевих моделей. Метою дослідження було підвищити точність відбору ключових словосполучень і зменшити обсяг «шуму» в аналізі без значного втручання людини.На початковому етапі проаналізовано карту сайту, із якої відсіяно документи допоміжного характеру, після чого сформовано великий корпус текстів. Виконано лематизацію та очищення від стоп-слів, що дозволило значно скоротити різноманіття словоформ і підготувати дані для глибшого аналізу. Основним інструментом вибору термінів став класичний метод частотно-зворотно-частотного ранжування, який успішно виявляє найуживаніші слова, але не враховує семантичних зв’язків складних фраз. Щоб підвищити семантичну релевантність, інтегровано нейромодель із власною фільтрацією малозначущих конструкцій. Додатково застосовано метод ковзаючого вікна для формування контекстних триплетів із ключовим словом у центрі, що сприяє виявленню справді змістовних фраз. На заключному етапі текстова модель автоматично генерує та коригує заголовки, мета-теги, абзаци й описи зображень відповідно до сучасних рекомендацій. Результати демонструють помітне зростання точності добору ключів, зменшення рівня «шуму» та приведення характеристик тексту до практичних норм, що забезпечує прогнозоване підвищення клікабельності. Автоматизований аудит також виявив дисбаланс у використанні заголовків різного рівня, який впливає на індексацію, і на його основі сформульовано рекомендації щодо оптимізації структури сторінок. Загалом поєднання статистичних алгоритмів і нейромережевих інструментів створює ефективну платформу для розробки автономних SEO-асистентів, здатних адаптуватися до динамічних змін у цифровому середовищі без постійного контролю людини.

Посилання

Optimize content rank in AI search results : веб-сайт [Електронний ресурс] / Xponent21 Insights. URL: https://xponent21.com/insights/optimize-content-rank-in-ai- search-results/ (дата звернення: 01.05.2025).

AI SEO Revolution – or Risk? : веб-сайт [Електронний ресурс] / IthElps Digital. URL: https://www.ithelps-digital.com/en/blog/ai-seo-revolution-or-risk (дата звернення: 01.05.2025).

Using AI for Metadata Tagging to Improve Resource Discovery : веб-сайт [Електронний ресурс] / Choice360. URL: https://www.choice360.org/libtech-insight/using-ai-for-metadata-tagging-to-improve-resource-discovery/ (дата звернення: 01.05.2025).

AI-Based Content Optimization: Trends and Applications [Електронний ресурс] / IJNRD. URL: https://www.ijnrd.org/papers/IJNRD2405009.pdf (дата звернення: 01.05.2025).

Neural Text Transformations for SEO Tasks [Електронний ресурс] / arXiv. URL: https://arxiv.org/html/2312.07214v1 (дата звернення: 01.05.2025).

Keyword Research // Search Engine Optimization (SEO): An Hour a Day : монографія [Монографія] / J. Grappone, G. Couzin. Indianapolis : Sybex, 2007. С. 45–68.

Морфологічний аналіз і семантична розмітка // Просування сайтів у пошукових системах : монографія [Монографія] / І. С. Ашманов, О. І. Іванов. Київ : BHV, 2014. С. 138–172.

Devlin J., Chang M.-W., Lee K., Toutanova K. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding // Proceedings of NAACL-HLT 2019. Minneapolis, MN : Association for Computational Linguistics, 2019. С. 4171–4186.

llama-4-scout-17b-16e-instruct [Електронний ресурс] / Meta. URL: https://huggingface.co/meta-llama/llama-4-scout-17b-16e-instruct (дата звернення: 01.05.2025).

Alterens – Автономні сонячні електростанції від Alterens! : веб-сайт [Елек- тронний ресурс] / Alterens. URL: https://alterens.com (дата звернення: 01.05.2025).

On-Page SEO // Search Engine Optimization (SEO): An Hour a Day : монографія [Монографія] / J. Grappone, G. Couzin. Indianapolis : Sybex, 2007. С. 95–120.

Groq Cloud API for chat completions : веб-сайт [Електронний ресурс] / Groq. URL: https://api.groq.com/openai/v1/chat/completions (дата звернення: 01.05.2025).

Metadata & Microformats // Search Engine Optimization (SEO): An Hour a Day : монографія [Монографія] / J. Grappone, G. Couzin. Indianapolis : Sybex, 2007. С. 121–140.

Tracking & Analytics // Search Engine Optimization (SEO): An Hour a Day : монографія [Монографія] / J. Grappone, G. Couzin. Indianapolis : Sybex, 2007. С. 217–242.

##submission.downloads##

Опубліковано

2025-05-29

Як цитувати

Сілін, І. Д., Потапова, К. Р., & Наливайчук, М. В. (2025). МОДИФІКОВАНИЙ АЛГОРИТМ TF-IDF ДЛЯ SEO-ОПТИМІЗАЦІЇ НА ОСНОВІ КОНТЕКСТНОГО АНАЛІЗУ МОДЕЛІ BERT ТА GROQ API. Таврійський науковий вісник. Серія: Технічні науки, (2), 180-192. вилучено із https://www.journals.ksauniv.ks.ua/index.php/tech/article/view/883

Номер

Розділ

КОМП’ЮТЕРНІ НАУКИ ТА ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ

Статті цього автора (авторів), які найбільше читають