Problem Identification
Systematic analysis of SEO poisoning attacks targeting educational domains, identifying patterns, attack vectors, and impact assessment through empirical observation and threat intelligence gathering.
A research-based cybersecurity solution designed to protect educational domain integrity (.ac.id) from malicious content infiltration through advanced machine learning analysis and comprehensive threat detection.
Sistem tidak aktif 24/7. Jika halaman login tidak dapat diakses, hubungi admin.
Empirical statistics demonstrating the severity of malicious content threats targeting educational domains
.ac.id domains compromised in last 6 months
System detection accuracy
Domains successfully remediated
Real-time monitoring
Penelitian ini mengembangkan sistem adaptif untuk mendeteksi SEO poisoning pada domain pendidikan Indonesia (.ac.id dan .sch.id) menggunakan metodologi Design Science Research. Sistem dirancang untuk menjawab tantangan keamanan siber di lingkungan pendidikan, ketika penyerang mengeksploitasi reputasi domain akademik guna menyebarkan konten ilegal melalui teknik web cloaking. Pendekatan pemindaian eksternal dan internal mengombinasikan Google Dorking untuk identifikasi konten terindeks dengan analisis struktur situs melalui sitemap crawling, sehingga cakupan deteksi menjadi lebih komprehensif.
Verifikasi konten diferensial berbasis Selenium digunakan untuk membandingkan tampilan konten antara perspektif pengguna umum dan crawler mesin pencari, sekaligus mengatasi keterbatasan static scraping. Sistem menerapkan mekanisme human-in-the-loop yang memungkinkan administrator memvalidasi hasil deteksi dan mengintegrasikannya ke dalam dataset pelatihan secara berkelanjutan. Dengan mekanisme ini, model machine learning dapat diperbarui mengikuti pola serangan terkini.
Evaluasi terhadap 745 sampel menunjukkan Random Forest sebagai model optimal dengan akurasi 90 persen dan F1-Score 0,87 dalam klasifikasi empat kategori ancaman. Sistem akhir dilengkapi antarmuka web berbasis Django dan fitur manajemen kuota pemindaian. Implementasi ini memberikan solusi komprehensif untuk memantau dan melindungi integritas domain pendidikan secara proaktif, membuktikan efektivitas pendekatan DSR dalam menghasilkan artefak teknologi yang responsif terhadap ancaman saat ini dan adaptif menghadapi evolusi serangan di masa depan.
SEO Poisoning, Educational Domain Security, Machine Learning, Design Science Research, Cybersecurity, Malicious Content Detection
Design Science Research (DSR) with iterative development cycles, empirical validation, and real-world deployment testing
Systematic analysis of SEO poisoning attacks targeting educational domains, identifying patterns, attack vectors, and impact assessment through empirical observation and threat intelligence gathering.
Development of adaptive detection system architecture integrating machine learning classification, multi-source data collection (Google dorking, subdomain enumeration, web crawling), and real-time monitoring capabilities.
Comprehensive testing using real-world datasets, performance metrics evaluation (accuracy, precision, recall, F1-score), and validation through deployment in production environments with educational institutions.
Continuous improvement through feedback loops, model retraining with new threat patterns, and system optimization based on real-world performance data and user feedback.
Educational domains (.ac.id) represent high-authority digital assets in search engines, making them prime targets for malicious content injection including online gambling, pornography, and phishing schemes.
Our system provides a proactive solution through comprehensive scanning and analysis of .ac.id domains to detect infiltrated pages, assisting administrators in remediation efforts and maintaining institutional integrity.
Berikut adalah beberapa contoh serangan yang sering terjadi pada domain .ac.id
Penyerang memanfaatkan celah keamanan pada formulir login atau pencarian untuk menyisipkan kode SQL berbahaya.
' OR '1'='1 -- (Contoh payload)
Script berbahaya disisipkan ke dalam halaman web yang kemudian dieksekusi di browser pengunjung.
<script>alert('XSS Attack')</script>
File berbahaya diupload melalui fitur upload yang tidak aman, kemudian didistribusikan ke pengunjung.
malware.exe
Konten malicious yang sering disisipkan ke subdomain
Menggunakan domain terpercaya untuk mencuri data
Teknologi canggih yang menggabungkan kecerdasan buatan dengan pemindaian mendalam
Menggunakan model *Machine Learning* (Random Forest) dengan **akurasi 91.2%** untuk mengklasifikasikan konten.
Akurasi Tinggi
Tidak hanya halaman utama, sistem melakukan enumerasi *subdomain* dan analisis *crawling* mendalam.
Pemindaian Mendalam
Dibangun di atas REST API (Django) dan dapat diakses melalui aplikasi *mobile* (Flutter) *real-time*.
Akses Real-time
Explore the comprehensive interface of HARMSCAN system, showcasing scanning capabilities, detailed results analysis, machine learning insights, and automated PDF reporting.
Comprehensive scanning interface allowing users to initiate domain scans, configure scan parameters, and monitor real-time progress. Supports multiple scan types including comprehensive Google search and web crawling.
Detailed scan results presentation with categorized findings, threat severity assessment, URL verification status, and comprehensive metadata. Includes deep analysis of detected malicious content with actionable insights.
Machine learning classification interface displaying model predictions, confidence scores, feature importance, and classification results. Shows Random Forest model performance with 91.2% accuracy metrics.
Comprehensive PDF report generation with executive summary, detailed findings, threat categorization, remediation recommendations, and visual analytics. Professional format suitable for institutional documentation and compliance.
Experience the full capabilities of HARMSCAN system
Access SystemJawaban untuk pertanyaan umum tentang sistem deteksi malicious kami
Tim yang berdedikasi dalam pengembangan sistem deteksi malicious untuk melindungi domain pendidikan Indonesia
Mahasiswa - NIM 22103041067
Pengembang utama sistem deteksi malicious. Bertanggung jawab atas implementasi machine learning dan pengembangan aplikasi web.
Dosen Pembimbing 1
NPP: 05.18.1.0523
NIDN: 0612017701
Sinta Id: 12368
Email: rifmillenia@gmail.com
Dosen Pembimbing 2
NPP: 05.18.1.0494
NIDN: 0612039002
Sinta Id: 6895379
Email: ardian.fachreza@unwahas.ac.id
Untuk informasi lebih lanjut atau kolaborasi
Hubungi Tim KamiM. Mas'ud, A. Hidayat, and A. Fachreza, "Adaptive SEO Poisoning Detection System for Educational Domains Using Design Science Research and Machine Learning," HARMSCAN Research Project, 2025.