Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, Trenöz Akademi kanalında yayınlanan bir eğitim dersidir. Eğitmen, Python programlama dilinde öznitelik mühendisliği konusunu anlatmaktadır.
- Video, öznitelik mühendisliğinin temel kavramlarını ve uygulamalarını kapsamaktadır. İçerikte kategorik verilerin One Hot Encoder ile, text verilerinin Count Vectorer ile sayısal kodlanması, polinomsal özniteliklerin türetilmesi, kayıp verilerin ortalamayla değiştirilmesi ve Cyclearn kütüphanesindeki Pypline kullanarak özniteliklerin ikinci dereceye dönüştürülmesi gibi konular ele alınmaktadır.
- Eğitim, Python ve Scikit-learn kütüphanesi kullanılarak kodlanmakta olup, lineer regresyon modelinin oluşturulması gibi öznitelik mühendisliği aşamalarını adım adım göstermektedir. Video, öznitelik mühendisliği konusunun son bölümü olup, izleyicilere Python ve kütüphaneleri derslerine de atıfta bulunulmaktadır.
- Öznitelik Mühendisliği Giriş
- Öznitelik mühendisliği, makine öğrenmesi uygulamalarında verileri hazırlamayı ve dönüştürmeyi içerir.
- Gerçek dünyada veriler nadiren derli toplu ve sayısal olur; kategorik veya metin tipte olabilir.
- Bu derste kategorik ve metin tipte özniteliklerin dönüştürülmesi, öznitelik türetme ve kayıp verilerin ele alınması gösterilecektir.
- 01:26Kategorik Verilerin Kodlanması
- Kategorik verileri sayısal kodlama ile haritalamak yerine, one hot encoding tekniği kullanılır.
- One hot encoding, kategorilerin varlığı ve yokluğu için ekstra sütunlar ekleyerek 0 ve 1 kodlarını kullanır.
- Scikit-learn'de bu işlem için DictVectorizer sınıfı kullanılır ve spars argümanı True olarak ayarlanarak veri setinin büyüklüğü azaltılabilir.
- 04:41Metin Verilerinin Kodlanması
- Metin verileri analiz edilirken kelime sayısına göre sayısal kodlara çevrilir.
- Scikit-learn'de CountVectorizer sınıfı metin verilerini kelime sayısına göre vektörleştirir.
- Vektörleştirilmiş veriyi daha iyi görmek için pandas kütüphanesi kullanılarak DataFrame'e dönüştürülür.
- 06:28Polinomsal Öznitelikler
- Lineer regresyon modeli verilere uygun değilse, polinomsal öznitelikler eklenerek modelin esnekliği artırılabilir.
- Scikit-learn'de PolynomialFeatures sınıfı kullanılarak verilere polinomsal dönüşüm uygulanabilir.
- Polinomsal dönüşüm uygulandığında model verilere daha iyi uyum sağlar.
- 10:10Kayıp Verilerin Ele Alınması
- Kayıp veriler None ile gösterilir ve makine öğrenmesi modeline uygulanmadan önce doldurulmalıdır.
- Kayıp verileri doldurmak için sütun ortalaması kullanmak gibi basit yöntemler veya matematiksel tamamlama gibi gelişmiş stratejiler kullanılabilir.
- Scikit-learn'de SimpleImputer sınıfı kullanılarak kayıp veriler sütun ortalamalarıyla doldurulabilir.
- 12:18Makine Öğrenmesi Piyplinesi
- Kayıp verilerin ortalamasıyla doldurulması, özniteliklerin ikinci dereceye dönüştürülmesi ve lineer regresyon modelinin oluşturulması gibi adımları tek seferde yapmak için cct learn'de pypline kullanılır.
- Piypline oluşturmak için cyclearn pypline'dan make pipline'ı import edip, model isminde bir değişkene atama yapılır.
- Make pipline fonksiyonuna strateji argümanına "min", polinomial feature argümanına "2" ve lineer regresyon yazarak bir pipline oluşturulur.
- 13:03Piypline Kullanımı ve Kapanış
- Oluşturulan pipline model fit fonksiyonu ile verilere uygulanabilir ve model predict metodu ile tahminler yapılabilir.
- Kanalda dörtyüzden fazla eğitim videosu bulunmakta ve özellikle Python ve kütüphaneleri dersleri tavsiye edilmektedir.
- Derslerin linklerine videonun altındaki açıklamalardan ulaşılabilir.