Hitters Linear Regression With Python
Kullanacağımız veri seti Carnegie Mellon Üniversitesi’nde bulunan StatLib kütüphanesinden alınmıştır. Veri seti 1988 ASA Grafik Bölümü Poster Oturumu’nda kullanılan verilerin bir parçasıdır. Maaş verileri orijinal olarak Sports Illustrated, 20 Nisan 1987’den alınmıştır. 1986 ve kariyer istatistikleri, Collier Books, Macmillan Publishing Company, New York tarafından yayınlanan 1987 Beyzbol Ansiklopedisi Güncellemesinden elde edilmiştir. Salary yani maaş değişkeninini bu projede linear regression ile tahmin edeceğiz.
Veri setini daha yakından tanımak adına değişkenleri tanıyalım:
AtBat: 1986–1987 sezonunda bir beyzbol sopası ile topa yapılan vuruş sayısı
Hits: 1986–1987 sezonundaki isabet sayısı
HmRun: 1986–1987 sezonundaki en değerli vuruş sayısı
Runs: 1986–1987 sezonunda takımına kazandırdığı sayı
RBI: Bir vurucunun vuruş yaptığında koşu yaptırdığı oyuncu sayısı
Walks: Karşı oyuncuya yaptırılan hata sayısı
Years: Oyuncunun