Regressions Variables arteko harremanak aztertzen
Regressioa datu-meatzaritza teknika bat da, balio numerikoen (aurreikusitako balioak ere deitzen zaie) datu multzo jakin bat aurreikusteko erabiltzen dena. Adibidez, erregresioa produktu edo zerbitzu baten kostua aurreikusteko erabil daiteke, beste aldagai batzuk emanez.
Negozioen eta marketinaren plangintza, finantza aurreikuspena, ingurumenaren modelizazioa eta joeren analisia sektore askotan erabiltzen dira.
Regressions vs. Sailkapena
Erregresio eta sailkapenaren antzeko arazoak konpontzeko erabilitako datu-meatzaritza teknikak dira, baina sarritan nahasi egiten dira. Bi iragarpenen analisietan erabiltzen dira, baina erregresioa balio numeriko edo etengabea aurreikusteko erabiltzen da, sailkapenean kategoria diskretuen datuak esleitzen zaizkion bitartean.
Esate baterako, erregresioa etxeko baten balioa aurreikusteko erabiliko litzateke, kokapenean, oin karratuetan, prezioan saldutakoan, antzeko etxeen prezioa eta beste faktore batzuk. Sailkapena ordena izango litzateke antolatu beharrean etxeak kategoriatan banatzeko, adibidez, ibilerak, tamaina asko edo krimen tasak.
Regresio tekniken motak
Erregresio forma errazena eta zaharrena bi aldagaien arteko erlazioa kalkulatzeko erabiltzen den regresio lineala da. Teknika honek lerro zuzenaren formula matematikoa (y = mx + b) erabiltzen du. Baldintza arruntean, hau da, Y eta X ardatzaren grafiko bat emanda, X eta Y arteko erlazioa lerro zuzen batzuk dauka. Esate baterako, uste dugu, biztanleriaren hazkundea dela eta, elikagaien produkzioa tasa berean handituko litzateke. Horrek bi zifren arteko harreman sendo eta lineala eskatzen du. Hau ikusteko, kontuan hartu grafiko bat, Y ardatzaren ibilbideak biztanleriaren gehikuntzarekin eta X ardatzaren ibilbideak elikagaien ekoizpenarekin. Y balioa handitzen den heinean, X balioa tasa berean handituko litzateke, lerro zuzenaren arteko erlazioa eginez.
Teknika aurreratuak, hala nola, hainbat regresioren bidez, aldagai anitzen arteko erlazioa aurreikusten dute, adibidez, errenta, hezkuntza eta bizi aukeratzen den korrelazioa? Aldagai gehiago gehitzea nabarmen iragarpenaren konplexutasuna handitzen du. Hainbat erregresio mota daude, hala nola, estandarra, hierarkikoa, zentzuzkoa eta urratsez osatua, bakoitza bere aplikazioarekin.
Puntu honetan, garrantzitsua da aurreikusten saiatzen ari garenik (aldagai menpeko edo aurreikusitakoa ) eta aurreikuspena egiteko erabiltzen ditugun datuak (aldagai independenteak edo aurreikusleak ). Gure adibidean, errenta eta hezkuntza (aldagai aurresistenteak ) bizi den aukeratutako kokapena ( aurreikusitako aldagaia) aurreikustea nahi dugu.
- Erregresio anizko estandarrak aldi berean aurreikusten dituen aldagai guztiak hartzen ditu kontuan. Adibidez 1) zer da errenta eta hezkuntza (aurreikusleak) eta auzoaren aukeraketa (aurreikusitakoa) artean? eta 2) noraino banatzen diren iragarle bakoitzak harreman horri laguntzen dio?
- Urratsa hainbat erregresio erantzuten du erabat bestelako galdera bat. Aurrerapen erregresio algoritmoko algoritmoek aurreikusleak auzoaren aukera aurreikusteko erabiltzen dituztenak aztertuko dituzte, urrats-ereduak aldagai iragankorren garrantziaren ordena ebaluatzen du eta, ondoren, azpimarratu garrantzitsua hautatuko du. Regression arazoen mota honek "urratsak" erabiltzen ditu erregresio ekuazioa garatzeko. Erregresio mota hau kontuan hartuta, aurrelarien guztiak ez dira azken erregresio ekuazioan agertuko.
- Erregresio hierarkikoa , urratsez urrats bezala, prozesu sekuentziala da, baina predictor aldagaiak aurrez zehaztutako ordena lehenago definitutako ereduan sartzen dira, hau da, algoritmoak ez du ekuazio multzo bat barne hartzen ordena ordena horretan sartu iragarleak. Hau gehien erabiltzen da errektoreen ekuazioa sortzean, eremuaren ezagutza aditua.
- Ezarpenaren erregresioa urratsez urrats antzekoa da, baina aldagai multzoen analisia baino ez ditu aldagai indibidualik.