Doğru sayısal veriler
katlanabilirsiniz. Örneğin, bir evin değerini alanına göre tahmin eden bir model düşünün.
Ev fiyatlarını değerlendirmek için yararlı bir modelin genellikle yüzlerce özelliğe dayandığını unutmayın. Bununla birlikte, diğer tüm koşullar aynı olduğunda 200 metrekarelik bir evin değeri, 100 metrekarelik aynı evin değerinin yaklaşık iki katı olmalıdır.
Çoğu zaman tamsayı değerleri içeren özellikleri
kategorik verileri kullanır. Örneğin,
değerlerin tam sayı olduğu kod özelliği. Bunu temsil ediyorsanız
özellik sayısını kategorik olarak değil, sayısal olarak göstermek istediğinizde, modele
sayısal bir ilişki bulmak için
ekleyebilirsiniz. Yani modele, müşterilerinizin
20004 posta kodu, posta kodundan iki kat (veya yarısı) daha büyük bir sinyal olarak ele alınır
10002. Posta kodlarını kategorik veri olarak göstermek,
her posta kodunun ağırlığını ayrı ayrı alın.
Kodlama
Kodlama kategorik verilerin veya diğer verilerin sayısal vektörlere dönüştürülmesi anlamına gelir
tek bir fonksiyona değineceğiz. Modeller yalnızca kayan nokta değerleriyle eğitilebildiği için bu dönüşüm gereklidir. Modeller "dog" veya "maple" gibi dizelerle eğitilemez. Bu modülde, proje yönetimiyle ilgili
kodlama yöntemlerini
öğrenmek için kullanır.
[[["Anlaması kolay","easyToUnderstand","thumb-up"],["Sorunumu çözdü","solvedMyProblem","thumb-up"],["Diğer","otherUp","thumb-up"]],[["İhtiyacım olan bilgiler yok","missingTheInformationINeed","thumb-down"],["Çok karmaşık / çok fazla adım var","tooComplicatedTooManySteps","thumb-down"],["Güncel değil","outOfDate","thumb-down"],["Çeviri sorunu","translationIssue","thumb-down"],["Örnek veya kod sorunu","samplesCodeIssue","thumb-down"],["Diğer","otherDown","thumb-down"]],["Son güncelleme tarihi: 2025-07-27 UTC."],[[["This module focuses on differentiating between categorical and numerical data within machine learning."],["You will learn how to represent categorical data using one-hot vectors and address common issues associated with it."],["The module covers encoding techniques for converting categorical data into numerical vectors suitable for model training."],["Feature crosses, a method for combining categorical features to capture interactions, are also discussed."],["It is assumed you have prior knowledge of introductory machine learning and working with numerical data."]]],[]]