Erregresio estatistikoko eredua definitzea

Regressions Variables arteko harremanak aztertzen

Regressioa datu-meatzaritza teknika bat da, balio numerikoen (aurreikusitako balioak ere deitzen zaie) datu multzo jakin bat aurreikusteko erabiltzen dena. Adibidez, erregresioa produktu edo zerbitzu baten kostua aurreikusteko erabil daiteke, beste aldagai batzuk emanez.

Negozioen eta marketinaren plangintza, finantza aurreikuspena, ingurumenaren modelizazioa eta joeren analisia sektore askotan erabiltzen dira.

Regressions vs. Sailkapena

Erregresio eta sailkapenaren antzeko arazoak konpontzeko erabilitako datu-meatzaritza teknikak dira, baina sarritan nahasi egiten dira. Bi iragarpenen analisietan erabiltzen dira, baina erregresioa balio numeriko edo etengabea aurreikusteko erabiltzen da, sailkapenean kategoria diskretuen datuak esleitzen zaizkion bitartean.

Esate baterako, erregresioa etxeko baten balioa aurreikusteko erabiliko litzateke, kokapenean, oin karratuetan, prezioan saldutakoan, antzeko etxeen prezioa eta beste faktore batzuk. Sailkapena ordena izango litzateke antolatu beharrean etxeak kategoriatan banatzeko, adibidez, ibilerak, tamaina asko edo krimen tasak.

Regresio tekniken motak

Erregresio forma errazena eta zaharrena bi aldagaien arteko erlazioa kalkulatzeko erabiltzen den regresio lineala da. Teknika honek lerro zuzenaren formula matematikoa (y = mx + b) erabiltzen du. Baldintza arruntean, hau da, Y eta X ardatzaren grafiko bat emanda, X eta Y arteko erlazioa lerro zuzen batzuk dauka. Esate baterako, uste dugu, biztanleriaren hazkundea dela eta, elikagaien produkzioa tasa berean handituko litzateke. Horrek bi zifren arteko harreman sendo eta lineala eskatzen du. Hau ikusteko, kontuan hartu grafiko bat, Y ardatzaren ibilbideak biztanleriaren gehikuntzarekin eta X ardatzaren ibilbideak elikagaien ekoizpenarekin. Y balioa handitzen den heinean, X balioa tasa berean handituko litzateke, lerro zuzenaren arteko erlazioa eginez.

Teknika aurreratuak, hala nola, hainbat regresioren bidez, aldagai anitzen arteko erlazioa aurreikusten dute, adibidez, errenta, hezkuntza eta bizi aukeratzen den korrelazioa? Aldagai gehiago gehitzea nabarmen iragarpenaren konplexutasuna handitzen du. Hainbat erregresio mota daude, hala nola, estandarra, hierarkikoa, zentzuzkoa eta urratsez osatua, bakoitza bere aplikazioarekin.

Puntu honetan, garrantzitsua da aurreikusten saiatzen ari garenik (aldagai menpeko edo aurreikusitakoa ) eta aurreikuspena egiteko erabiltzen ditugun datuak (aldagai independenteak edo aurreikusleak ). Gure adibidean, errenta eta hezkuntza (aldagai aurresistenteak ) bizi den aukeratutako kokapena ( aurreikusitako aldagaia) aurreikustea nahi dugu.