Python ve makine öğrenmesi teknikleri kullanarak arabam.com sitesindeki araç ilanlarını analiz eden ve marka-model tahmini yapan doğal dil işleme projesi. Web scraping ve NLP algoritmaları ile geliştirilmiştir.
Bu proje, arabam.com sitesindeki araç ilanlarından toplanan metin verilerini analiz ederek, ilanların hangi marka ve modele ait olduğunu tahmin eden bir makine öğrenmesi uygulamasıdır. Doğal dil işleme teknikleri ve çeşitli sınıflandırma algoritmaları kullanılarak geliştirilmiştir.
Beautiful Soup ile web scraping yaparak arabam.com'dan araç ilanları ve detayları toplandı.
Pandas ile veri temizleme, eksik değerlerin doldurulması ve outlier'ların temizlenmesi.
NLTK ile Türkçe metin işleme, tokenization, stemming ve feature extraction.
Scikit-learn ile çeşitli ML algoritmaları denenerek en iyi performans elde edildi.
Projede farklı makine öğrenmesi algoritmaları test edilmiş ve performansları karşılaştırılmıştır:
Türkçe metin verilerini işlemek için kullanılan NLP teknikleri:
Proje geliştirme sürecinde kullanılan araçlar ve metodoloji:
Modelin başarı kriterleri ve elde edilen sonuçlar:
Toparlanan ve işlenen veri setinin karakteristikleri:
Proje sürecinde karşılaşılan başlıca zorluklar:
Projenin gelecek versiyonlarında planlanan iyileştirmeler: