Арга хамгийн бага квадратууд регрессийн тэгшитгэлийн параметрүүдийг тооцоолоход ашигладаг.
Мөрийн тоо (эх мэдээлэл)

Шинж чанар хоорондын стохастик хамаарлыг судлах аргуудын нэг бол регрессийн шинжилгээ юм.
Регрессийн шинжилгээ гэдэг нь олоход ашигладаг регрессийн тэгшитгэлийн гарал үүслийг хэлнэ дундаж утгаөөр (эсвэл бусад) хувьсагчийн (хүчин зүйл-шинж чанарууд) утга нь мэдэгдэж байгаа бол санамсаргүй хэмжигдэхүүн (үр дүнгийн шинж чанар). Үүнд дараах алхмууд орно.

  1. холболтын хэлбэрийг сонгох (аналитик регрессийн тэгшитгэлийн төрөл);
  2. тэгшитгэлийн параметрийн тооцоо;
  3. аналитик регрессийн тэгшитгэлийн чанарын үнэлгээ.
Ихэнхдээ шугаман хэлбэрийг шинж чанаруудын статистик хамаарлыг тодорхойлоход ашигладаг. Шугаман харилцаанд анхаарлаа хандуулж байгаа нь түүний параметрүүдийн эдийн засгийн тодорхой тайлбар, хувьсах хэмжигдэхүүний хязгаарлагдмал өөрчлөлт, ихэнх тохиолдолд шугаман бус хэлбэрийг (логарифм эсвэл хувьсагчийн орлуулалтаар) тооцоолол хийх зорилгоор шугаман хэлбэрт шилжүүлдэгтэй холбон тайлбарладаг. .
Шугаман хос хамаарлын хувьд регрессийн тэгшитгэл нь y i =a+b·x i +u i хэлбэртэй байна. Энэ тэгшитгэлийн a ба b параметрүүдийг өгөгдлөөр тооцсон болно статистик ажиглалт x ба y. Ийм үнэлгээний үр дүн нь тэгшитгэл юм: , энд , a ба b параметрийн тооцоолол , регрессийн тэгшитгэлээс (тооцсон утга) олж авсан шинж чанарын (хувьсагчийн) утга юм.

Ихэнхдээ параметрүүдийг тооцоолоход ашигладаг хамгийн бага квадратын арга (LSM).
Хамгийн бага квадратын арга нь регрессийн тэгшитгэлийн параметрүүдийн хамгийн сайн (тогтвортой, үр ашигтай, шударга бус) үнэлгээг өгдөг. Гэхдээ санамсаргүй нэр томъёо (u) ба бие даасан хувьсагч (x)-ын талаархи тодорхой таамаглалууд хангагдсан тохиолдолд л (OLS таамаглалыг үзнэ үү).

Шугаман хос тэгшитгэлийн параметрүүдийг хамгийн бага квадратын аргаар тооцоолох асуудалдараах байдалтай байна: үр дүнгийн шинж чанарын бодит утгуудын квадрат хазайлтын нийлбэр нь тооцоолсон утгуудаас y i - хамгийн бага байх параметрүүдийн ийм тооцоог олж авах.
Албан ёсоор OLS шалгуурингэж бичиж болно: .

Хамгийн бага квадратын аргуудын ангилал

  1. Хамгийн бага квадратын арга.
  2. Хамгийн их магадлалын арга (хэвийн сонгодог шугаман регрессийн загварын хувьд регрессийн үлдэгдлийн хэвийн байдлыг тогтооно).
  3. Алдааны автокорреляци болон гетероскедастикийн тохиолдолд ерөнхийлсөн хамгийн бага квадратын OLS аргыг ашигладаг.
  4. Жинлэсэн хамгийн бага квадратын арга ( онцгой тохиолдолгетероскедатик үлдэгдэл бүхий OLS).

Гол санааг тайлбарлая сонгодог аргаграфикаар хамгийн бага квадратууд. Үүнийг хийхийн тулд бид ажиглалтын өгөгдөл (x i , y i , i=1;n) дээр үндэслэн тархалтын графикийг байгуулна. тэгш өнцөгт системкоординат (ийм цэгийн графикийг корреляцийн талбар гэж нэрлэдэг). Корреляцийн талбайн цэгүүдэд хамгийн ойр байх шулуун шугамыг сонгохыг хичээцгээе. Хамгийн бага квадратын аргын дагуу шугамыг корреляцийн талбайн цэгүүд ба энэ шугамын хоорондох босоо зайны квадратуудын нийлбэр хамгийн бага байхаар сонгоно.

Энэ асуудлын математик тэмдэглэгээ: .
y i ба x i =1...n утгууд нь бидэнд мэдэгдэж байгаа бөгөөд эдгээр нь ажиглалтын өгөгдөл юм. S функцэд тэдгээр нь тогтмолуудыг илэрхийлдэг. Энэ функцын хувьсагч нь параметрүүдийн шаардлагатай тооцоолол юм - , . Хоёр хувьсагчийн функцийн хамгийн бага утгыг олохын тулд параметр бүрийн хувьд энэ функцийн хэсэгчилсэн деривативыг тооцоолж, тэгтэй тэнцүүлэх шаардлагатай. .
Үүний үр дүнд бид 2 хэвийн системийг олж авдаг шугаман тэгшитгэл:
Шийдвэрлэж байна энэ систем, бид шаардлагатай параметрийн тооцоог олно:

Регрессийн тэгшитгэлийн параметрүүдийн тооцооны зөв эсэхийг дүнг харьцуулах замаар шалгаж болно (тооцооллыг дугуйрсанаас болж зарим зөрүүтэй байж болно).
Параметрийн тооцоог тооцоолохын тулд та 1-р хүснэгтийг үүсгэж болно.
Регрессийн коэффициент b тэмдэг нь харилцааны чиглэлийг заана (хэрэв b >0 бол хамаарал шууд, хэрэв b бол<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
Албан ёсоор a параметрийн утга нь x нь тэгтэй тэнцэх y-ийн дундаж утга юм. Хэрэв атрибут хүчин зүйл нь тэг утгагүй бөгөөд байж чадахгүй бол a параметрийн дээрх тайлбар нь утгагүй болно.

Онцлог шинж чанаруудын хоорондын харилцааны ойр байдлыг үнэлэх шугаман хос корреляцийн коэффициент - r x,y ашиглан гүйцэтгэнэ. Үүнийг дараах томъёогоор тооцоолж болно. . Үүнээс гадна шугаман хос корреляцийн коэффициентийг b регрессийн коэффициентээр тодорхойлж болно: .
Шугаман хос корреляцийн коэффициентийн зөвшөөрөгдөх утгын хүрээ нь -1-ээс +1 хүртэл байна. Корреляцийн коэффициентийн тэмдэг нь харилцааны чиглэлийг заана. Хэрэв r x, y >0 бол холболт шууд байна; хэрэв r x, y<0, то связь обратная.
Хэрэв энэ коэффициент хэмжигдэхүүнээр нэгдмэл байвал шинж чанаруудын хоорондын хамаарлыг нэлээд ойр шугаман гэж тайлбарлаж болно. Хэрэв түүний модуль нь нэг ê r x, y ê =1-тэй тэнцүү бол шинж чанаруудын хоорондын хамаарал функциональ шугаман байна. Хэрэв x ба y шинж чанарууд нь шугаман хамааралгүй бол r x,y нь 0-тэй ойролцоо байна.
r x,y-ийг тооцоолохдоо 1-р хүснэгтийг ашиглаж болно.

Хүснэгт 1

N ажиглалтx iy ix i ∙y i
1 x 1y 1x 1 y 1
2 x 2y 2x 2 y 2
...
nx nу нx n y n
Баганын нийлбэр∑x∑ ж∑xy
Дундаж утга
Үүссэн регрессийн тэгшитгэлийн чанарыг үнэлэхийн тулд детерминацийн онолын коэффициент - R 2 yx -ийг тооцоолно.

,
Энд d 2 нь регрессийн тэгшитгэлээр тайлбарласан y-ийн дисперс;
e 2 - y-ийн үлдэгдэл (регрессийн тэгшитгэлээр тайлбарлагдаагүй) дисперс;
s 2 y - y-ийн нийт (нийт) дисперс.
Детерминацийн коэффициент нь регресс (болон улмаар х хүчин зүйл)-ээр тайлбарласан үр дүнгийн шинж чанарын y-ийн өөрчлөлтийн (тархалтын) хувь хэмжээг тодорхойлдог. Тодорхойлох коэффициент R 2 yx нь 0-ээс 1 хүртэлх утгыг авна. Үүний дагуу 1-R 2 yx утга нь загвар болон техникийн үзүүлэлтийн алдааг харгалзан үзээгүй бусад хүчин зүйлийн нөлөөллөөс үүссэн y хэлбэлзлийн эзлэх хувийг тодорхойлдог.
Хосолсон шугаман регрессийн үед R 2 yx =r 2 yx.

Туршилтын өгөгдлийг ойртуулах нь туршилтаар олж авсан өгөгдлийг анхны утгуудтай (туршилт эсвэл туршилтын явцад олж авсан өгөгдөл) зангилааны цэгүүдэд хамгийн ойрхон дамждаг эсвэл давхцдаг аналитик функцээр солиход үндэслэсэн арга юм. Одоогийн байдлаар аналитик функцийг тодорхойлох хоёр арга байдаг:

Дамждаг n зэрэглэлийн интерполяцийн олон гишүүнтийг байгуулснаар бүх цэгээр шуудөгөгдсөн өгөгдлийн массив. Энэ тохиолдолд ойролцоолох функцийг дараах хэлбэрээр үзүүлэв: Лагранж хэлбэрийн интерполяцийн олон гишүүнт эсвэл Ньютон хэлбэрийн интерполяцийн олон гишүүнт.

Дамждаг n зэрэгтэй ойролцоо олон гишүүнт байгуулснаар цэгүүдэд хамгийн ойр байрладагӨгөгдсөн өгөгдлийн массиваас. Тиймээс ойролцоолох функц нь туршилтын явцад гарч болох бүх санамсаргүй дуу чимээг (эсвэл алдааг) жигд болгодог: туршилтын явцад хэмжсэн утгууд нь өөрсдийн санамсаргүй хуулиудын дагуу өөрчлөгддөг санамсаргүй хүчин зүйлээс хамаарна (хэмжилт эсвэл багажийн алдаа, алдаа, туршилтын алдаа) алдаа). Энэ тохиолдолд ойртох функцийг хамгийн бага квадратын аргыг ашиглан тодорхойлно.

Хамгийн бага квадратын арга(Англи уран зохиолын энгийн хамгийн бага квадратууд, OLS) нь өгөгдсөн туршилтын өгөгдлийн массивын цэгүүдэд хамгийн ойрын зайд баригдсан ойролцоолсон функцийг тодорхойлоход суурилсан математик арга юм. Анхны болон ойролцоолсон функцүүдийн F(x)-ийн ойролцоо байдлыг тоон хэмжүүрээр тодорхойлно, тухайлбал: F(x) ойролцоох муруйгаас туршилтын өгөгдлийн квадрат хазайлтын нийлбэр нь хамгийн бага байх ёстой.

Хамгийн бага квадратын аргыг ашиглан ойролцоогоор муруй байгуулав

Хамгийн бага квадратын аргыг ашигладаг:

Тэгшитгэлийн тоо үл мэдэгдэх тооноос хэтэрсэн тохиолдолд хэт тодорхойлогдсон тэгшитгэлийн системийг шийдвэрлэх;

Энгийн (хэт тодорхойлогдоогүй) шугаман бус тэгшитгэлийн системийн шийдлийг олох;

Ойролцоох функц бүхий цэгийн утгыг ойртуулах.

Туршилтын өгөгдлийн массиваас тооцоолсон ойролцоолох функцийн квадрат хазайлтын хамгийн бага нийлбэрийн нөхцлөөс хамгийн бага квадратын аргыг ашиглан ойролцоолсон функцийг тодорхойлно. Хамгийн бага квадратын аргын энэ шалгуурыг дараах илэрхийлэл хэлбэрээр бичнэ.

Зангилааны цэгүүд дээр тооцоолсон ойролцоолох функцийн утгууд,

Зангилааны цэг дээрх туршилтын өгөгдлийн массив.

Квадрат шалгуур нь олон гишүүнт ойртуулах функцээр ойртуулах асуудлыг шийдвэрлэх өвөрмөц шийдэл болох ялгах чадвар зэрэг хэд хэдэн "сайн" шинж чанартай байдаг.

Бодлогын нөхцлөөс хамааран ойролцоолох функц нь m зэрэгтэй олон гишүүнт юм

Ойролцоох функцийн зэрэг нь зангилааны цэгүүдийн тооноос хамаардаггүй, гэхдээ түүний хэмжээ нь өгөгдсөн туршилтын өгөгдлийн массивын хэмжээсээс (цэгүүдийн тоо) үргэлж бага байх ёстой.

∙ Ойролцоо функцийн зэрэг нь m=1 бол хүснэгтэн функцийг шулуун шугамаар (шугаман регресс) ойролцоолно.

∙ Ойролцоо функцийн зэрэг нь m=2 бол хүснэгтийн функцийг квадрат параболаар (квадрат ойролцоо) ойролцоолно.

∙ Ойролцоо функцийн зэрэг нь m=3 бол хүснэгтийн функцийг куб параболаар (куб ойролцоо) ойролцоогоор тооцоолно.

Ерөнхий тохиолдолд өгөгдсөн хүснэгтийн утгуудын хувьд ойролцоогоор m зэрэгтэй олон гишүүнт байгуулах шаардлагатай үед бүх зангилааны цэгүүдийн квадрат хазайлтын нийлбэрийн хамгийн бага нөхцөлийг дараах хэлбэрээр дахин бичнэ.

- m зэрэгтэй ойролцоо олон гишүүнтийн үл мэдэгдэх коэффициентүүд;

Тодорхойлсон хүснэгтийн утгуудын тоо.

Функцийн хамгийн бага байх зайлшгүй нөхцөл бол үл мэдэгдэх хувьсагчдын хувьд түүний хэсэгчилсэн деривативын тэгтэй тэнцүү байх явдал юм. . Үүний үр дүнд бид дараах тэгшитгэлийн системийг олж авна.

Үр дүнг нь өөрчилье шугаман системтэгшитгэл: хаалт нээж, чөлөөт нэр томъёог илэрхийллийн баруун талд шилжүүлнэ. Үүний үр дүнд шугаман алгебр илэрхийллийн системийг дараах хэлбэрээр бичнэ.

Энэхүү шугаман алгебр илэрхийллийн системийг матриц хэлбэрээр дахин бичиж болно.

Үүний үр дүнд m+1 үл мэдэгдэхээс бүрдэх m+1 хэмжээст шугаман тэгшитгэлийн системийг олж авсан. Энэ системийг шугаман алгебрийн тэгшитгэлийг шийдвэрлэх ямар ч аргыг ашиглан шийдэж болно (жишээлбэл, Гауссын арга). Уг шийдлийн үр дүнд анхны өгөгдлөөс ойртсон функцийн квадрат хазайлтын хамгийн бага нийлбэрийг өгдөг ойролцоолох функцийн үл мэдэгдэх параметрүүдийг олох болно, өөрөөр хэлбэл. хамгийн боломжит квадрат ойролцоо тооцоолол. Хэрэв эх өгөгдлийн нэг утга өөрчлөгдвөл бүх коэффициентүүд нь эх өгөгдлөөр бүрэн тодорхойлогддог тул утгуудаа өөрчилнө гэдгийг санах нь зүйтэй.

Шугаман хамаарлаар эх өгөгдлийн ойролцоолсон

(шугаман регресс)

Жишээлбэл, шугаман хамаарлын хэлбэрээр тодорхойлогдсон ойролцоолсон функцийг тодорхойлох аргачлалыг авч үзье. Хамгийн бага квадратын аргын дагуу квадрат хазайлтын нийлбэрийн хамгийн бага нөхцөлийг дараах хэлбэрээр бичнэ.

Хүснэгтийн зангилааны координатууд;

Шугаман хамаарал гэж тодорхойлсон ойролцоолох функцийн үл мэдэгдэх коэффициентүүд.

Функцийн хамгийн бага байх зайлшгүй нөхцөл бол үл мэдэгдэх хувьсагчдын хувьд түүний хэсэгчилсэн деривативын тэгтэй тэнцүү байх явдал юм. Үүний үр дүнд бид дараах тэгшитгэлийн системийг олж авна.

Үүссэн шугаман тэгшитгэлийн системийг хувиргацгаая.

Бид үүссэн шугаман тэгшитгэлийн системийг шийддэг. Аналитик хэлбэрээр ойртох функцийн коэффициентийг дараах байдлаар тодорхойлно (Крамерын арга):

Эдгээр коэффициентүүд нь өгөгдсөн хүснэгтийн утгуудаас (туршилтын өгөгдөл) ойролцоолсон функцийн квадратуудын нийлбэрийг багасгах шалгуурын дагуу шугаман ойролцоо функцийг бий болгох боломжийг олгодог.

Хамгийн бага квадратын аргыг хэрэгжүүлэх алгоритм

1. Анхны өгөгдөл:

N хэмжилтийн тоо бүхий туршилтын өгөгдлийн массивыг зааж өгсөн болно

Ойролцоо олон гишүүнт (m) зэргийг зааж өгсөн болно

2. Тооцооллын алгоритм:

2.1. Хэмжээ бүхий тэгшитгэлийн системийг бий болгохын тулд коэффициентүүдийг тодорхойлно

Тэгшитгэлийн системийн коэффициентүүд (тэгшитгэлийн зүүн тал)

- тэгшитгэлийн системийн квадрат матрицын баганын дугаарын индекс

Шугаман тэгшитгэлийн системийн чөлөөт нөхцлүүд (тэгшитгэлийн баруун тал)

- тэгшитгэлийн системийн квадрат матрицын эгнээний дугаарын индекс

2.2. Хэмжээтэй шугаман тэгшитгэлийн системийг бүрдүүлэх.

2.3. m зэрэгтэй ойролцоо олон гишүүнтийн үл мэдэгдэх коэффициентийг тодорхойлох шугаман тэгшитгэлийн системийг шийдвэрлэх.

2.4 Бүх зангилааны цэгүүдийн анхны утгаас ойртож буй олон гишүүнтийн квадрат хазайлтын нийлбэрийг тодорхойлох.

Квадрат хазайлтын нийлбэрийн олсон утга нь боломжит хамгийн бага байна.

Бусад функцуудыг ашиглан ойртуулах

Анхны өгөгдлийг хамгийн бага квадратын аргын дагуу ойртуулахдаа логарифмын функц, экспоненциал функц, чадлын функцийг заримдаа ойртох функц болгон ашигладаг гэдгийг тэмдэглэх нь зүйтэй.

Логарифмын ойролцоо тооцоолол

Ойролцоо функцийг логарифмын функцээр өгөгдсөн тохиолдолд авч үзье.

Хамгийн бага квадратын арга

Хамгийн бага квадратын арга ( OLS, OLS, энгийн хамгийн бага квадратууд) - түүврийн өгөгдлийг ашиглан регрессийн загваруудын үл мэдэгдэх параметрүүдийг тооцоолох регрессийн шинжилгээний үндсэн аргуудын нэг. Энэ арга нь регрессийн үлдэгдэл квадратуудын нийлбэрийг багасгахад суурилдаг.

Шийдэл нь шаардлагатай хувьсагчийн зарим функцын квадратуудын нийлбэрийг багасгах шалгуурыг хангасан эсвэл хангасан тохиолдолд хамгийн бага квадратын аргыг өөрөө аль ч талбарт асуудлыг шийдвэрлэх арга гэж нэрлэж болно гэдгийг тэмдэглэх нь зүйтэй. Тиймээс тэгшитгэл эсвэл хязгаарлалтыг хангасан тоо нь эдгээр хэмжигдэхүүний тооноос давсан хэмжигдэхүүнийг олохдоо өгөгдсөн функцийг бусад (илүү энгийн) функцээр ойролцоогоор илэрхийлэх (ойролцоогоор) хамгийн бага квадратын аргыг ашиглаж болно. , гэх мэт.

MNC-ийн мөн чанар

(тайлбарласан) хувьсагчийн хоорондох магадлалын (регрессийн) хамаарлын зарим (параметр) загварыг өгье. yболон олон хүчин зүйл (тайлбарлах хувьсагч) x

Үл мэдэгдэх загварын параметрийн вектор хаана байна

- санамсаргүй загварын алдаа.

Эдгээр хувьсагчийн утгын талаархи түүвэр ажиглалтууд бас байг. Ажиглалтын дугаар () байг. Дараа нь ажиглалт дахь хувьсагчдын утгууд байна. Дараа нь b параметрийн өгөгдсөн утгуудын хувьд тайлбарласан y хувьсагчийн онолын (загвар) утгыг тооцоолох боломжтой.

Үлдэгдэлийн хэмжээ нь параметрийн утгаас хамаарна b.

Хамгийн бага квадратын аргын (энгийн, сонгодог) мөн чанар нь үлдэгдлийн квадратуудын нийлбэр байх b параметрийг олох явдал юм. Квадратуудын үлдэгдэл нийлбэр) хамгийн бага байх болно:

Ерөнхий тохиолдолд энэ асуудлыг тоон оновчлолын (багаруулах) аргаар шийдэж болно. Энэ тохиолдолд тэд ярьдаг шугаман бус хамгийн бага квадратууд(NLS эсвэл NLLS - Англи хэл) Шугаман бус хамгийн бага квадратууд). Ихэнх тохиолдолд аналитик шийдлийг олж авах боломжтой байдаг. Багасгах асуудлыг шийдэхийн тулд үл мэдэгдэх параметрүүд b-ээс ялгаж, деривативуудыг тэгтэй тэнцүүлж, үүссэн тэгшитгэлийн системийг шийдэх замаар функцийн суурин цэгүүдийг олох шаардлагатай.

Хэрэв загварын санамсаргүй алдаа нь хэвийн тархсан, ижил хэлбэлзэлтэй, хамааралгүй бол OLS параметрийн тооцоолол нь хамгийн их магадлалтай тооцоолол (MLM)-тай ижил байна.

Шугаман загварын хувьд OLS

Регрессийн хамаарлыг шугаман болгоё:

Болъё yнь тайлбарласан хувьсагчийн ажиглалтын баганын вектор бөгөөд хүчин зүйлийн ажиглалтын матриц юм (матрицын мөрүүд нь тухайн ажиглалтын хүчин зүйлийн утгын векторууд, баганууд нь тухайн хүчин зүйлийн утгын векторууд юм. бүх ажиглалтанд). Шугаман загварын матриц дүрслэл нь:

Дараа нь тайлбарласан хувьсагчийн үнэлгээний вектор ба регрессийн үлдэгдэл вектор тэнцүү байна.

Үүний дагуу регрессийн үлдэгдлийн квадратуудын нийлбэр нь тэнцүү байх болно

Параметрийн векторын хувьд энэ функцийг ялгаж, деривативуудыг тэгтэй тэнцүүлэх замаар бид тэгшитгэлийн системийг (матриц хэлбэрээр) олж авна.

.

Энэхүү тэгшитгэлийн системийн шийдэл нь шугаман загварын хамгийн бага квадратын тооцооны ерөнхий томъёог өгдөг.

Аналитик зорилгоор энэ томъёоны сүүлчийн дүрслэл нь ашигтай байдаг. Хэрэв регрессийн загварт өгөгдөл төвтэй, тэгвэл энэ дүрслэлд эхний матриц нь хүчин зүйлийн түүвэр ковариацын матриц гэсэн утгатай, хоёр дахь нь хамааралтай хувьсагчтай хүчин зүйлсийн ковариацын вектор юм. Хэрэв үүнээс гадна өгөгдөл нь мөн хэвийн болгосонМХБ-д (энэ нь эцсийн дүндээ стандартчилагдсан), дараа нь эхний матриц нь хүчин зүйлсийн түүвэр корреляцийн матриц, хоёр дахь вектор нь хамааралтай хувьсагчтай хүчин зүйлсийн түүвэр корреляцийн вектор гэсэн утгатай байна.

Загваруудын OLS тооцооны чухал шинж чанар тогтмолтой- барьсан регрессийн шугам нь түүврийн өгөгдлийн хүндийн төвөөр дамжин өнгөрдөг, өөрөөр хэлбэл тэгш байдал хангагдана.

Ялангуяа онцгой тохиолдолд, цорын ганц регрессор нь тогтмол байх үед бид цорын ганц параметрийн OLS үнэлгээ (тогтмол өөрөө) тайлбарласан хувьсагчийн дундаж утгатай тэнцүү болохыг олж мэднэ. Өөрөөр хэлбэл, олон тооны хуулиас сайн шинж чанараараа алдартай арифметик дундаж нь хамгийн бага квадратын тооцоолол юм - энэ нь түүнээс хазайсан квадратын хамгийн бага нийлбэрийн шалгуурыг хангадаг.

Жишээ нь: хамгийн энгийн (хосоор) регресс

Хосолсон шугаман регрессийн хувьд тооцооллын томъёог хялбаршуулсан (та матриц алгебргүйгээр хийж болно):

OLS тооцоологчдын шинж чанарууд

Юуны өмнө шугаман загваруудын хувьд OLS тооцоолол нь дээрх томьёоны дагуу шугаман тооцоолол гэдгийг бид тэмдэглэж байна. Шударга бус OLS тооцооллын хувьд регрессийн шинжилгээний хамгийн чухал нөхцлийг биелүүлэхэд шаардлагатай бөгөөд хангалттай: хүчин зүйлээс шалтгаалсан санамсаргүй алдааны математик хүлээлт тэгтэй тэнцүү байх ёстой. Энэ нөхцөл, ялангуяа, хэрэв хангагдсан бол

  1. санамсаргүй алдааны математикийн хүлээлт тэг, ба
  2. хүчин зүйлс ба санамсаргүй алдаа нь бие даасан санамсаргүй хэмжигдэхүүн юм.

Хоёрдахь нөхцөл - хүчин зүйлийн экзоген байдлын нөхцөл нь суурь юм. Хэрэв энэ өмчийг хангаагүй бол бараг бүх тооцоо нь туйлын хангалтгүй байх болно гэж бид таамаглаж болно: тэдгээр нь бүр тогтвортой биш байх болно (өөрөөр хэлбэл маш их хэмжээний мэдээлэл ч гэсэн энэ тохиолдолд өндөр чанарын тооцоог авах боломжийг бидэнд олгодоггүй. ). Сонгодог тохиолдолд санамсаргүй алдаанаас ялгаатай хүчин зүйлсийн детерминизмын талаар илүү хүчтэй таамаглал дэвшүүлсэн бөгөөд энэ нь автоматаар экзогенийн нөхцөл хангагдсан гэсэн үг юм. Ерөнхий тохиолдолд тооцооллыг нийцүүлэхийн тулд түүврийн хэмжээ хязгааргүй болтлоо өсөхөд матрицын зарим нэг бус матрицад ойртохын хамт экзогенийн нөхцөлийг хангахад хангалттай.

Тогтвортой, шударга байдлаас гадна (ердийн) хамгийн бага квадратуудын тооцоо үр дүнтэй байхын тулд (шугаман бус үнэлгээний ангилалд хамгийн сайн) санамсаргүй алдааны нэмэлт шинж чанаруудыг хангасан байх ёстой.

Эдгээр таамаглалыг санамсаргүй алдааны векторын ковариацын матрицад зориулж томъёолж болно

Эдгээр нөхцлийг хангасан шугаман загварыг гэнэ сонгодог. Сонгодог шугаман регрессийн OLS тооцоолол нь бүх шугаман шударга бус тооцооллын ангилалд хамааралгүй, тууштай бөгөөд хамгийн үр дүнтэй тооцоолол юм (Англи ном зохиолд заримдаа товчлолыг ашигладаг. ЦЭНХЭР (Шилдэг шугаман үндэслэлгүй тооцоологч) - хамгийн сайн шугаман бус үнэлгээ; Оросын уран зохиолд Гаусс-Марковын теоремыг илүү их иш татдаг). Үзүүлэхэд хялбар тул коэффициентийн тооцооллын векторын ковариацын матриц нь дараахтай тэнцүү байна.

Ерөнхий OLS

Хамгийн бага квадратын арга нь өргөн хүрээний ерөнхий ойлголтыг бий болгодог. Үлдэгдлийн квадратуудын нийлбэрийг багасгахын оронд үлдэгдэл векторын эерэг тодорхой квадрат хэлбэрийг багасгаж болно, энд зарим тэгш хэмтэй эерэг тодорхой жинтэй матриц байна. Уламжлалт хамгийн бага квадратууд нь жингийн матриц нь таних матрицтай пропорциональ байдаг энэ аргын онцгой тохиолдол юм. Тэгш хэмтэй матрицуудын (эсвэл операторуудын) онолоос мэдэгдэж байгаачлан ийм матрицын хувьд задрал байдаг. Тиймээс, заасан функцийг дараах байдлаар илэрхийлж болно, өөрөөр хэлбэл энэ функцийг зарим өөрчлөгдсөн "үлдэгдэл" -ийн квадратуудын нийлбэрээр илэрхийлж болно. Тиймээс бид хамгийн бага квадратын аргуудын ангиллыг ялгаж чадна - LS аргууд (Бага квадратууд).

Ерөнхий шугаман регрессийн загварын хувьд (санамсаргүй алдааны ковариацын матрицад хязгаарлалт тавьдаггүй) хамгийн үр дүнтэй (шугаман бус үнэлгээний ангилалд) тооцоолол гэж нэрлэгддэг нь батлагдсан (Айткенийн теорем). ерөнхийлсөн хамгийн бага квадратууд (GLS - Ерөнхий жижиг квадратууд)- Санамсаргүй алдааны урвуу ковариацын матрицтай тэнцүү жингийн матрицтай LS арга: .

Шугаман загварын параметрүүдийн GLS үнэлгээний томъёо нь хэлбэртэй байгааг харуулж болно

Эдгээр тооцооллын ковариацын матриц нь зохих ёсоор тэнцүү байх болно

Үнэн хэрэгтээ OLS-ийн мөн чанар нь анхны өгөгдлийн тодорхой (шугаман) хувиргалт (P) болон хувирсан өгөгдөлд ердийн OLS-ийг хэрэглэхэд оршдог. Энэхүү хувиргалтын зорилго нь хувиргасан өгөгдлийн хувьд санамсаргүй алдаа нь сонгодог таамаглалыг аль хэдийн хангасан байх явдал юм.

Жинлэсэн OLS

Диагональ жингийн матрицын хувьд (тиймээс санамсаргүй алдааны ковариацын матриц) бид хамгийн бага жигнэсэн квадратууд (WLS) гэж нэрлэгддэг. Энэ тохиолдолд загварын үлдэгдлийн квадратуудын жигнэсэн нийлбэрийг багасгасан, өөрөөр хэлбэл ажиглалт бүр нь энэхүү ажиглалтын санамсаргүй алдааны дисперстэй урвуу хамааралтай "жин"-ийг хүлээн авдаг: . Үнэн хэрэгтээ, өгөгдлийг ажиглалтыг жинлэх замаар (санамсаргүй алдааны тооцоолсон стандарт хазайлттай пропорциональ хэмжээгээр хуваах) хувиргадаг бөгөөд жигнэсэн өгөгдөлд энгийн OLS-ийг ашигладаг.

MNC-ийг практикт ашиглах зарим онцгой тохиолдлууд

Шугаман хамаарлыг ойртуулах

Тодорхой скаляр хэмжигдэхүүнийг тодорхой скаляр хэмжигдэхүүнээс хамаарлыг судалсны үр дүнд (энэ нь жишээлбэл, хүчдэлийн гүйдлийн хүчнээс хамаарах хамаарал байж болно: , тогтмол утга хаана байна, эсэргүүцэл дамжуулагч), эдгээр хэмжигдэхүүнүүдийн хэмжилт хийгдсэн бөгөөд үүний үр дүнд утгууд ба тэдгээрийн холбогдох утгууд. Хэмжилтийн өгөгдлийг хүснэгтэд тэмдэглэсэн байх ёстой.

Хүснэгт. Хэмжилтийн үр дүн.

Хэмжилтийн дугаар.
1
2
3
4
5
6

Асуулт нь: хамаарлыг хамгийн сайн тодорхойлохын тулд коэффициентийн ямар утгыг сонгож болох вэ? Хамгийн бага квадратын аргын дагуу энэ утга нь утгуудын утгуудын квадрат хазайлтын нийлбэр байх ёстой.

хамгийн бага байсан

Квадрат хазайлтын нийлбэр нь нэг экстремумтай байдаг - хамгийн бага нь энэ томъёог ашиглах боломжийг бидэнд олгодог. Энэ томъёоноос коэффициентийн утгыг олъё. Үүнийг хийхийн тулд бид түүний зүүн талыг дараах байдлаар хувиргана.

Сүүлийн томъёо нь асуудалд шаардлагатай байсан коэффициентийн утгыг олох боломжийг бидэнд олгодог.

Өгүүллэг

19-р зууны эхэн үе хүртэл. эрдэмтэд үл мэдэгдэх тоо нь тэгшитгэлийн тооноос бага байх тэгшитгэлийн системийг шийдвэрлэх тодорхой дүрэмгүй байсан; Тэр үеийг хүртэл тэгшитгэлийн төрөл, тооны машинуудын мэргэн ухаанаас хамаардаг хувийн техникийг ашигладаг байсан тул ижил ажиглалтын өгөгдөл дээр үндэслэн өөр өөр тооцоолуур өөр өөр дүгнэлтэд хүрчээ. Энэ аргыг анх удаа Гаусс (1795) ашигласан бөгөөд Лежендре (1805) бие даан нээж, орчин үеийн нэрээр (Франц. Méthode des moindres quarrés ). Лаплас энэ аргыг магадлалын онолтой холбосон бөгөөд Америкийн математикч Адрейн (1808) магадлалын онолын хэрэглээг авч үзсэн. Энэ арга нь Энке, Бессел, Хансен болон бусад хүмүүсийн цаашдын судалгаагаар өргөн тархсан бөгөөд сайжруулсан.

OLS-ийн өөр хэрэглээ

Хамгийн бага квадратын аргын санааг регрессийн шинжилгээтэй шууд холбоогүй бусад тохиолдолд ашиглаж болно. Баримт нь квадратуудын нийлбэр нь векторуудын хамгийн түгээмэл ойрын хэмжүүрүүдийн нэг юм (хязгаарлагдмал хэмжээст орон зай дахь Евклидийн хэмжүүр).

Нэг хэрэглээ бол тэгшитгэлийн тоо нь хувьсагчийн тооноос их байх шугаман тэгшитгэлийн системийн "шийдвэр" юм.

Энд матриц нь дөрвөлжин биш, тэгш өнцөгт хэлбэртэй байна.

Ийм тэгшитгэлийн систем нь ерөнхий тохиолдолд ямар ч шийдэлгүй (хэрэв зэрэглэл нь хувьсагчийн тооноос их байвал). Иймд энэ системийг зөвхөн векторуудын хоорондох "зай"-ыг багасгахын тулд ийм вектор сонгох утгаар л "шийдвэрлэх" боломжтой. Үүнийг хийхийн тулд та системийн тэгшитгэлийн зүүн ба баруун талуудын ялгааны квадратуудын нийлбэрийг багасгах шалгуурыг ашиглаж болно, өөрөөр хэлбэл. Энэхүү багасгах асуудлыг шийдэх нь дараах тэгшитгэлийн системийг шийдвэрлэхэд хүргэдэг гэдгийг харуулахад хялбар байдаг

Тэгшлүүлсний дараа бид дараах хэлбэрийн функцийг олж авна: g (x) = x + 1 3 + 1 .

Бид энэ өгөгдлийг y = a x + b шугаман хамаарлыг ашиглан харгалзах параметрүүдийг тооцоолж болно. Үүнийг хийхийн тулд бид хамгийн бага квадрат гэж нэрлэгддэг аргыг ашиглах хэрэгтэй болно. Туршилтын өгөгдлийг аль шугамыг хамгийн сайн уялдуулахыг шалгахын тулд та мөн зураг зурах хэрэгтэй.

Yandex.RTB R-A-339285-1

OLS (хамгийн бага квадратын арга) гэж юу вэ?

Бидний хийх ёстой гол зүйл бол F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 гэсэн хоёр хувьсагчийн функцийн утга нь шугаман хамаарлын ийм коэффициентийг олох явдал юм. хамгийн жижиг. Өөрөөр хэлбэл, a ба b-ийн тодорхой утгуудын хувьд үүссэн шулуун шугамаас танилцуулсан өгөгдлийн квадрат хазайлтын нийлбэр нь хамгийн бага утгатай байх болно. Энэ бол хамгийн бага квадратын аргын утга юм. Жишээг шийдэхийн тулд бид хоёр хувьсагчийн функцийн экстремумыг олоход л хангалттай.

Коэффициентийг тооцоолох томъёог хэрхэн гаргах вэ

Коэффициентийг тооцоолох томъёог гаргахын тулд та хоёр хувьсагчтай тэгшитгэлийн системийг үүсгэж, шийдвэрлэх хэрэгтэй. Үүнийг хийхийн тулд F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 илэрхийллийн хэсэгчилсэн деривативуудыг a ба b-д хамааруулан тооцож 0-тэй тэнцүүлнэ.

δ F (a , b) δ a = 0 δ F (a , b) δ b = 0 ⇔ - 2 ∑ i = 1 n (y i - (a x i + b)) x i = 0 - 2 ∑ i = 1 n ( y i - (a x i + b)) = 0 ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = y ∑ i = a ∑ i = y 1 ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + n b = ∑ i = 1 n y i

Тэгшитгэлийн системийг шийдэхийн тулд та ямар ч аргыг ашиглаж болно, жишээлбэл, орлуулах эсвэл Крамерын арга. Үүний үр дүнд бид хамгийн бага квадратын аргыг ашиглан коэффициентийг тооцоолоход ашиглаж болох томьёотой байх ёстой.

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n ∑ i - i n

Бид функц байгаа хувьсагчдын утгыг тооцоолсон
F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 нь хамгийн бага утгыг авна. Гурав дахь догол мөрөнд бид яагаад яг ийм байгааг батлах болно.

Энэ бол хамгийн бага квадратын аргыг практикт ашиглах явдал юм. a параметрийг олоход ашигладаг түүний томьёо нь ∑ i = 1 n x i, ∑ i = 1 n y i, ∑ i = 1 n x i y i, ∑ i = 1 n x i 2, мөн параметрийг агуулна.
n – энэ нь туршилтын өгөгдлийн хэмжээг илэрхийлнэ. Бид танд тус бүрийг тусад нь тооцохыг зөвлөж байна. b коэффициентийн утгыг a-ийн дараа шууд тооцно.

Анхны жишээ рүү буцъя.

Жишээ 1

Энд бид n нь тавтай тэнцүү байна. Коэффициентийн томъёонд орсон шаардлагатай хэмжээг тооцоолоход илүү хялбар болгохын тулд хүснэгтийг бөглөнө үү.

i = 1 i=2 би = 3 i=4 i=5 ∑ i = 1 5
x i 0 1 2 4 5 12
y i 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
x i y i 0 2 , 4 5 , 2 11 , 2 15 33 , 8
x i 2 0 1 4 16 25 46

Шийдэл

Дөрөв дэх эгнээнд хоёр дахь эгнээний утгыг i хүн бүрийн гурав дахь утгуудаар үржүүлэх замаар олж авсан өгөгдлийг оруулна. Тав дахь мөрөнд дөрвөлжин хэлбэртэй хоёр дахь өгөгдлийг агуулна. Сүүлийн баганад тусдаа мөрүүдийн утгуудын нийлбэрийг харуулав.

Бидэнд хэрэгтэй a, b коэффициентүүдийг тооцоолохдоо хамгийн бага квадратын аргыг ашиглая. Үүнийг хийхийн тулд сүүлчийн баганаас шаардлагатай утгыг орлуулж, дүнг тооцоолно уу.

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n ∑ a = ∑ i - i 33, 8 - 12 12, 9 5 46 - 12 2 b = 12, 9 - a 12 5 ⇒ a ≈ 0, 165 b ≈ 2, 184

Шаардлагатай ойролцоо шулуун шугам нь y = 0, 165 x + 2, 184 шиг харагдах болно. Одоо бид аль шугам нь өгөгдлийг илүү сайн ойртуулахыг тодорхойлох хэрэгтэй - g (x) = x + 1 3 + 1 эсвэл 0, 165 x + 2, 184. Хамгийн бага квадратын аргыг ашиглан тооцоолъё.

Алдааг тооцоолохын тулд σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 ба σ 2 = ∑ i = 1 n (y i) шулуун шугамуудаас өгөгдлийн квадрат хазайлтын нийлбэрийг олох хэрэгтэй. - g (x i)) 2, хамгийн бага утга нь илүү тохиромжтой шугамтай тохирно.

σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = ∑ i = 1 5 (y i - (0, 165 x i + 2, 184)) 2 ≈ 0, 019 σ 2 = ∑ 1 n (y i - g (x i)) 2 = = ∑ i = 1 5 (y i - (x i + 1 3 + 1)) 2 ≈ 0.096

Хариулт:σ 1-ээс хойш< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
y = 0.165 x + 2.184.

Хамгийн бага квадратын аргыг график дүрслэлд тодорхой харуулав. Улаан шугам нь шулуун шугамыг g (x) = x + 1 3 + 1, цэнхэр шугам нь y = 0, 165 x + 2, 184-ийг тэмдэглэнэ. Анхны өгөгдлийг ягаан цэгээр тэмдэглэв.

Яагаад ийм төрлийн ойролцоо тооцоолол хэрэгтэй байгааг тайлбарлая.

Тэдгээрийг өгөгдлийг тэгшитгэх шаардлагатай ажлууд, түүнчлэн өгөгдлийг интерполяци хийх эсвэл экстраполяци хийх шаардлагатай ажлуудад ашиглаж болно. Жишээлбэл, дээр дурдсан бодлогод х = 3 эсвэл x = 6 үед ажиглагдсан у хэмжигдэхүүний утгыг олж болно. Ийм жишээнүүдэд бид тусдаа өгүүллийг зориулав.

OLS аргын баталгаа

a ба b-г тооцоолоход функц хамгийн бага утгыг авахын тулд өгөгдсөн цэг дээр F (a, b) хэлбэрийн функцийн дифференциалын квадрат хэлбэрийн матриц = ∑ i = байх шаардлагатай. 1 n (y i - (a x i + b)) 2 эерэг тодорхой. Энэ нь хэрхэн харагдах ёстойг харуулъя.

Жишээ 2

Бидэнд дараах хэлбэрийн хоёр дахь эрэмбийн дифференциал байна.

d 2 F (a ; b) = δ 2 F (a ; b) δ a 2 d 2 a + 2 δ 2 F (a ; b) δ a δ b d a d b + δ 2 F (a ; b) δ b 2 d 2 б

Шийдэл

δ 2 F (a ; b) δ a 2 = δ δ F (a ; b) δ a δ a = = δ - 2 ∑ i = 1 n (y i - (a x i + b)) x i δ a = 2 ∑ i = 1 n (x i) 2 δ 2 F (a; b) δ a δ b = δ δ F (a; b) δ a δ b = = δ - 2 ∑ i = 1 n (y i - (a x i + b) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F (a ; b) δ b 2 = δ δ F (a ; b) δ b δ b = δ - 2 ∑ i = 1 n (y i - (a x i +) b)) δ b = 2 ∑ i = 1 n (1) = 2 n

Өөрөөр хэлбэл бид үүнийг ингэж бичиж болно: d 2 F (a ; b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x i i = 1 n d a d b + (2 n) d 2 b.

Бид M = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n квадрат хэлбэрийн матрицыг олж авлаа.

Энэ тохиолдолд бие даасан элементүүдийн утга нь a ба b -ээс хамаарч өөрчлөгдөхгүй. Энэ матриц эерэг тодорхой мөн үү? Энэ асуултад хариулахын тулд түүний өнцгийн багачууд эерэг эсэхийг шалгацгаая.

Бид эхний эрэмбийн өнцгийн минорыг тооцоолно: 2 ∑ i = 1 n (x i) 2 > 0 . x i цэгүүд давхцдаггүй тул тэгш бус байдал нь хатуу байна. Цаашид тооцоо хийхдээ бид үүнийг анхаарч үзэх болно.

Бид хоёр дахь эрэмбийн өнцгийн минорыг тооцоолно.

d e t (M) = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - ∑ x i = 12

Үүний дараа бид n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 тэгш бус байдлыг математик индукцийн аргаар батлах ажлыг үргэлжлүүлнэ.

  1. Энэ тэгш бус байдал нь дурын n-д хүчинтэй эсэхийг шалгая. 2-ыг аваад тооцоолъё:

2 ∑ i = 1 2 (x i) 2 - ∑ i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = x 1 + x 2 2 > 0

Бид зөв тэгш байдлыг олж авлаа (хэрэв x 1 ба x 2 утгууд давхцахгүй бол).

  1. Энэ тэгш бус байдал нь n-ийн хувьд үнэн байх болно гэсэн таамаглалыг дэвшүүлье. n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 – үнэн.
  2. Одоо бид n + 1-ийн хүчинтэй байдлыг батлах болно, өөрөөр хэлбэл. (n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 > 0, хэрэв n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 .

Бид тооцоолно:

(n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 = = (n + 1) ∑ i = 1 n (x i) 2 + x n + 1 2 - ∑ i = 1 n x i + x n + 1 2 = = n ∑ i = 1 n (x i) 2 + n x n + 1 2 + ∑ i = 1 n (x i) 2 + x n + 1 2 - - ∑ i = 1 n x i 2 +2 x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + n x n + 1 2 - x n + 1 ∑ i = + 1 n xi = + 1 n xi n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 - 2 x n + 1 x 2 + x 2 2 + . . . + x n + 1 2 - 2 x n + 1 x 1 + x n 2 = = n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + + (x n + 1 - x 1) 2 + (x n + 1) - x 2) 2 + . . . + (x n - 1 - x n) 2 > 0

Буржгар хаалтанд оруулсан илэрхийлэл нь 0-ээс их байх болно (2-р алхам дээр бидний таамаглаж байсан зүйл дээр үндэслэн), үлдсэн нөхцөлүүд нь бүгд тооны квадрат тул 0-ээс их байх болно. Бид тэгш бус байдлыг нотолсон.

Хариулт:олсон a ба b нь F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 функцын хамгийн бага утгатай тохирч байх бөгөөд энэ нь тэдгээр нь хамгийн бага квадратын аргын шаардлагатай параметрүүд гэсэн үг юм. (LSM).

Хэрэв та текстэнд алдаа байгааг анзаарсан бол үүнийг тодруулаад Ctrl+Enter дарна уу

Функцийг 2-р зэргийн олон гишүүнтээр ойролцоолъё. Үүнийг хийхийн тулд бид ердийн тэгшитгэлийн системийн коэффициентийг тооцоолно.

, ,

Энгийн хамгийн бага квадратын системийг үүсгэцгээе, энэ нь дараах хэлбэртэй байна.

Системийн шийдлийг олоход хялбар байдаг:, , .

Ийнхүү 2-р зэргийн олон гишүүнт олдлоо: .

Онолын мэдээлэл

Хуудас руу буцах<Введение в вычислительную математику. Примеры>

Жишээ 2. Олон гишүүнтийн оновчтой зэрэглэлийг олох.

Хуудас руу буцах<Введение в вычислительную математику. Примеры>

Жишээ 3. Эмпирик хамаарлын параметрүүдийг олох тэгшитгэлийн хэвийн системийг гарган авах.

Коэффициент ба функцийг тодорхойлох тэгшитгэлийн системийг гаргаж авцгаая , энэ нь өгөгдсөн функцийн язгуурын квадратын ойролцооллыг цэгээр гүйцэтгэдэг. Функц зохиоё тэгээд түүнд зориулж бичээрэй шаардлагатай нөхцөлтуйлын:

Дараа нь ердийн систем дараах хэлбэрийг авна.

Бид үл мэдэгдэх параметрийн шугаман тэгшитгэлийн системийг олж авсан бөгөөд үүнийг амархан шийддэг.

Онолын мэдээлэл

Хуудас руу буцах<Введение в вычислительную математику. Примеры>

Жишээ.

Хувьсагчдын утгын туршилтын өгөгдөл XТэгээд цагтхүснэгтэд өгсөн болно.

Тэдгээрийг тохируулсны үр дүнд функцийг олж авдаг

Ашиглаж байна хамгийн бага квадратын арга, эдгээр өгөгдлийг шугаман хамаарлаар ойролцоол y=ax+b(параметрүүдийг олох АТэгээд б). Туршилтын өгөгдлийг (хамгийн бага квадратын аргын утгаараа) хоёр мөрийн аль нь илүү сайн нийцүүлж байгааг олж мэдээрэй. Зураг зурах.

Хамгийн бага квадратын аргын (LSM) мөн чанар.

Даалгавар бол хоёр хувьсагчийн функц ажиллах шугаман хамаарлын коэффициентийг олох явдал юм АТэгээд бхамгийн бага утгыг авдаг. Өгөгдсөн гэсэн үг АТэгээд болсон шулуун шугамаас туршилтын өгөгдлийн квадрат хазайлтын нийлбэр хамгийн бага байх болно. Энэ бол хамгийн бага квадратын аргын бүх санаа юм.

Тиймээс жишээг шийдэх нь хоёр хувьсагчийн функцийн экстремумыг олоход хүргэдэг.

Коэффициент олох томьёо гаргана.

Хоёр үл мэдэгдэх хоёр тэгшитгэлийн системийг эмхэтгэж, шийддэг. Функцийн хэсэгчилсэн деривативуудыг олох хувьсагчаар АТэгээд б, бид эдгээр деривативуудыг тэгтэй тэнцүүлж байна.

Бид үүссэн тэгшитгэлийн системийг ямар ч аргыг ашиглан шийддэг (жишээлбэл орлуулах аргаарэсвэл Крамерын арга) ба хамгийн бага квадратын арга (LSM) ашиглан коэффициентийг олох томъёог олж авна.

Өгсөн АТэгээд бфункц хамгийн бага утгыг авдаг. Энэ баримтын нотолгоог хуудасны төгсгөлд байгаа текстэнд доор харуулав.

Энэ бол хамгийн бага квадратуудын бүх арга юм. Параметрийг олох томъёо анийлбэр , , , болон параметрүүдийг агуулна n- туршилтын өгөгдлийн хэмжээ. Эдгээр дүнгийн утгыг тусад нь тооцоолохыг зөвлөж байна.

Коэффицент бтооцооны дараа олдсон а.

Анхны жишээг санах цаг болжээ.

Шийдэл.

Бидний жишээнд n=5. Шаардлагатай коэффициентүүдийн томъёонд орсон дүнг тооцоолоход хялбар байх үүднээс бид хүснэгтийг бөглөнө.

Хүснэгтийн дөрөв дэх эгнээний утгыг тоо бүрийн 2-р эгнээний утгыг 3-р эгнээний утгуудаар үржүүлэх замаар олж авна. би.

Хүснэгтийн тав дахь эгнээний утгыг тоо тус бүрийн 2-р эгнээний утгуудын квадратаар олж авна. би.

Хүснэгтийн сүүлчийн баганад байгаа утгууд нь мөр хоорондын утгуудын нийлбэр юм.

Коэффициентийг олохын тулд бид хамгийн бага квадратын аргын томъёог ашигладаг АТэгээд б. Бид хүснэгтийн сүүлчийн баганаас харгалзах утгуудыг тэдгээрт орлуулна.

Тиймээс, y = 0.165x+2.184- хүссэн ойролцоох шулуун шугам.

Энэ мөрүүдийн аль нь болохыг олж мэдэх л үлдлээ y = 0.165x+2.184эсвэл анхны өгөгдөлд илүү ойртож, өөрөөр хэлбэл хамгийн бага квадратын аргыг ашиглан тооцоолно.

Хамгийн бага квадратын аргын алдааны тооцоо.

Үүнийг хийхийн тулд та эдгээр мөрүүдээс анхны өгөгдлийн квадрат хазайлтын нийлбэрийг тооцоолох хэрэгтэй Тэгээд , жижиг утга нь хамгийн бага квадратын аргын утгаараа анхны өгөгдөлд илүү сайн ойртсон шугамтай тохирч байна.

-ээс хойш, дараа нь шууд y = 0.165x+2.184анхны өгөгдөлд илүү ойртох болно.

Хамгийн бага квадратуудын (LS) аргын график дүрслэл.

График дээр бүх зүйл тодорхой харагдаж байна. Улаан шугам нь олсон шулуун шугам юм y = 0.165x+2.184, цэнхэр шугам нь , ягаан цэгүүд нь анхны өгөгдөл юм.

Энэ яагаад хэрэгтэй байна вэ, яагаад энэ бүх ойртоод байгаа юм бэ?

Би үүнийг өгөгдлийн тэгшитгэх, интерполяци, экстраполяцийн асуудлыг шийдвэрлэхэд ашигладаг (анхны жишээнд тэднээс ажиглагдсан утгын утгыг олохыг хүссэн байж магадгүй юм. yцагт x=3эсвэл хэзээ x=6хамгийн бага квадратын аргыг ашиглан). Гэхдээ бид энэ талаар дараа нь сайтын өөр хэсэгт дэлгэрэнгүй ярих болно.

Хуудасны дээд талд

Баталгаа.

Тиймээс олдсон үед АТэгээд бфункц нь хамгийн бага утгыг авдаг тул энэ үед функцийн хоёр дахь эрэмбийн дифференциалын квадрат хэлбэрийн матриц шаардлагатай. эерэг тодорхой байсан. Үүнийг үзүүлье.

Хоёрдахь эрэмбийн дифференциал нь дараах хэлбэртэй байна.

Тэр нь

Тиймээс квадрат хэлбэрийн матриц нь хэлбэртэй байна

мөн элементүүдийн утга нь үүнээс хамаардаггүй АТэгээд б.

Матриц нь эерэг тодорхой гэдгийг харуулъя. Үүнийг хийхийн тулд өнцгийн насанд хүрээгүй хүмүүс эерэг байх ёстой.

Нэгдүгээр эрэмбийн өнцгийн минор . Оноонууд нь давхцдаггүй тул тэгш бус байдал нь хатуу байдаг. Дараах зүйлд бид үүнийг хэлэх болно.

Хоёрдахь эрэмбийн өнцгийн минор

Үүнийг баталцгаая Математик индукцийн аргаар.

Дүгнэлт: олсон утгууд АТэгээд бфункцийн хамгийн бага утгатай тохирно , тиймээс хамгийн бага квадратын аргын шаардлагатай параметрүүд юм.

Үүнийг ойлгох цаг алга уу?
Шийдэл захиалах

Хуудасны дээд талд

Хамгийн бага квадратын аргыг ашиглан таамаглал боловсруулах. Асуудлыг шийдэх жишээ

Экстраполяци Урьдчилан таамаглах объектын ирээдүйн хөгжилд өнгөрсөн болон одоогийн чиг хандлага, зүй тогтол, холболтыг түгээхэд үндэслэсэн шинжлэх ухааны судалгааны арга юм. Экстраполяцийн аргууд орно хөдөлж буй дундаж арга, экспоненциал тэгшитгэх арга, хамгийн бага квадратын арга.

Мөн чанар хамгийн бага квадратын арга ажиглагдсан болон тооцоолсон утгын хоорондох квадрат хазайлтын нийлбэрийг багасгахаас бүрдэнэ. Тооцоолсон утгыг сонгосон тэгшитгэл - регрессийн тэгшитгэлийг ашиглан олно. Бодит болон тооцоолсон утгуудын хоорондох зай бага байх тусам регрессийн тэгшитгэл дээр үндэслэн таамаглал илүү нарийвчлалтай болно.

Судалж буй үзэгдлийн мөн чанар, өөрчлөлтийг цаг хугацааны цуваагаар тусгасан онолын дүн шинжилгээ нь муруйг сонгох үндэс суурь болдог. Заримдаа цувралын түвшний өсөлтийн шинж чанарыг харгалзан үздэг. Иймээс гарцын өсөлт байх төлөвтэй байгаа бол арифметик прогресс, дараа нь тэгшлэх ажлыг шулуун шугамаар гүйцэтгэнэ. Хэрэв энэ нь өсөлттэй байгаа нь тогтоогдвол геометрийн прогресс, дараа нь экспоненциал функцийг ашиглан тэгшитгэх ёстой.

Хамгийн бага квадратын аргын ажлын томьёо : Y t+1 = a*X + b, энд t + 1 - урьдчилан таамаглах хугацаа; Уt+1 – таамагласан үзүүлэлт; a ба b коэффициентүүд; X - бэлэг тэмдэгцаг.

a ба b коэффициентийн тооцоог дараах томъёогоор гүйцэтгэнэ.

Энд, Uf - динамик цувралын бодит утгууд; n – хугацааны цувааны түвшний тоо;

Хамгийн бага квадратын аргыг ашиглан цаг хугацааны цувааг тэгшитгэх нь судалж буй үзэгдлийн хөгжлийн зүй тогтлыг тусгах үүрэгтэй. Трендийн аналитик илэрхийлэлд цагийг бие даасан хувьсагч гэж үздэг бөгөөд цувралын түвшин нь энэхүү бие даасан хувьсагчийн функцээр ажилладаг.

Аливаа үзэгдлийн хөгжил нь эхлэлийн цэгээс хойш хэдэн жил өнгөрсөнөөс хамаарахгүй, харин түүний хөгжилд ямар хүчин зүйл нөлөөлсөн, ямар чиглэлд, ямар эрчимтэй явагдсанаас хамаардаг. Эндээс үзэхэд аливаа үзэгдэл цаг хугацааны явцад үүсэх нь эдгээр хүчин зүйлсийн үйл ажиллагааны үр дүн юм.

Муруйн төрөл, цаг хугацааны аналитик хамаарлын төрлийг зөв тогтоох нь урьдчилан таамаглах шинжилгээний хамгийн хэцүү ажлуудын нэг юм. .

Параметрүүд нь хамгийн бага квадратын аргаар тодорхойлогддог чиг хандлагыг тодорхойлсон функцийн төрлийг сонгох нь ихэнх тохиолдолд эмпирик байдлаар хэд хэдэн функцийг бий болгож, тэдгээрийн утгын дагуу өөр хоорондоо харьцуулах замаар хийгддэг. томъёогоор тооцоолсон дундаж квадрат алдаа:

энд хэт ягаан туяа нь динамик цувралын бодит утгууд юм; Ur - динамик цувралын тооцоолсон (тэгшгэсэн) утгууд; n – хугацааны цувааны түвшний тоо; p – чиг хандлагыг (хөгжлийн чиг хандлага) тодорхойлсон томъёонд тодорхойлсон параметрүүдийн тоо.

Хамгийн бага квадратын аргын сул тал :

  • судалж буй эдийн засгийн үзэгдлийг математикийн тэгшитгэл ашиглан дүрслэхийг оролдох үед таамаглал нь богино хугацаанд үнэн зөв байх бөгөөд шинэ мэдээлэл гарах үед регрессийн тэгшитгэлийг дахин тооцоолох шаардлагатай;
  • стандарт компьютерийн программуудыг ашиглан шийдвэрлэх боломжтой регрессийн тэгшитгэлийг сонгоход төвөгтэй байдал.

Прогноз боловсруулахдаа хамгийн бага квадратын аргыг ашиглах жишээ

Даалгавар . Бүс нутгийн ажилгүйдлийн түвшинг тодорхойлсон тоо баримт байдаг, %

  • Хөдөлгөөнт дундаж, экспоненциал тэгшитгэх, хамгийн бага квадратыг ашиглан 11, 12, 1-р саруудад бүс нутгийн ажилгүйдлийн түвшингийн таамаглалыг бий болгох.
  • Арга тус бүрийг ашиглан үр дүнгийн таамаглал дахь алдааг тооцоол.
  • Үр дүнг харьцуулж, дүгнэлт гарга.

Хамгийн бага квадратын шийдэл

Үүнийг шийдэхийн тулд бид үйлдвэрлэх хүснэгтийг бий болгоё шаардлагатай тооцоо:

ε = 28.63/10 = 2.86% таамаглалын нарийвчлалөндөр.

Дүгнэлт : Тооцооллын үр дүнг харьцуулах хөдөлгөөнт дундаж арга , экспоненциал тэгшитгэх арга ба хамгийн бага квадратын аргын хувьд экспоненциал тэгшитгэх аргыг ашиглан тооцоолох дундаж харьцангуй алдаа нь 20-50% -ийн хүрээнд байна гэж хэлж болно. Энэ нь энэ тохиолдолд таамаглалын үнэн зөв нь зөвхөн хангалттай гэсэн үг юм.

Эхний болон гурав дахь тохиолдолд дундаж харьцангуй алдаа 10% -иас бага байдаг тул таамаглалын нарийвчлал өндөр байна. Гэхдээ хөдөлж буй дундаж арга нь илүү найдвартай үр дүнд хүрэх боломжийг олгосон (11-р сарын урьдчилсан мэдээ - 1.52%, 12-р сарын таамаглал - 1.53%, 1-р сарын урьдчилсан мэдээ - 1.49%), учир нь энэ аргыг ашиглах үед харьцангуй дундаж алдаа хамгийн бага байдаг - 1. .13%.

Хамгийн бага квадратын арга

Энэ сэдвээрх бусад нийтлэлүүд:

Ашигласан эх сурвалжуудын жагсаалт

  1. Нийгмийн эрсдэлийг оношлох, бэрхшээл, аюул занал, нийгмийн үр дагаврыг урьдчилан таамаглах шинжлэх ухаан, арга зүйн зөвлөмж. ОХУ-ын Нийгмийн их сургууль. Москва. 2010;
  2. Владимирова Л.П. Зах зээлийн нөхцөлд урьдчилан таамаглах, төлөвлөх: Сурах бичиг. тэтгэмж. М .: "Дашков ба Ко" хэвлэлийн газар, 2001;
  3. Новикова Н.В., Поздеева О.Г. Үндэсний эдийн засгийг урьдчилан таамаглах: Сургалт, арга зүйн гарын авлага. Екатеринбург: Уралын хэвлэлийн газар. муж эко. Их сургууль, 2007;
  4. Слуцкин Л.Н. Бизнесийн таамаглал дээр MBA курс. М .: Alpina Business Books, 2006.

MNC програм

Дэлгэрэнгүй мэдээллийг оруулна уу

Өгөгдөл ба ойролцоогоор y = a + b x

би- туршилтын цэгийн тоо;
x i- цэг дээрх тогтмол параметрийн утга би;
y i- цэг дээрх хэмжсэн параметрийн утга би;
ω i- нэг цэг дэх жинг хэмжих би;
y i, тооцоолол.- хэмжсэн болон регрессийн тооцоолсон утгын зөрүү yцэг дээр би;
S x i (x i)- алдааны тооцоо x iхэмжих үед yцэг дээр би.

Өгөгдөл ба ойролцоогоор y = k x

би x i y i ω i y i, тооцоолол. Δy би S x i (x i)

График дээр дарна уу

MNC онлайн программын хэрэглэгчийн гарын авлага.

Өгөгдлийн талбарт тусдаа мөр бүрт нэг туршилтын цэг дээр `x` ба `y` утгуудыг оруулна. Утга нь хоосон зайны тэмдэгтээр (зай эсвэл таб) тусгаарлагдсан байх ёстой.

Гурав дахь утга нь `w` цэгийн жин байж болно. Хэрэв цэгийн жинг заагаагүй бол нэгтэй тэнцүү байна. Ихэнх тохиолдолд туршилтын цэгүүдийн жин тодорхойгүй эсвэл тооцоологдоогүй, i.e. туршилтын бүх өгөгдлийг тэнцүү гэж үзнэ. Заримдаа судлагдсан утгын хүрээн дэх жин нь туйлын тэнцүү биш бөгөөд онолын хувьд ч тооцоолж болно. Жишээлбэл, спектрофотометрийн хувьд жинг энгийн томъёогоор тооцоолж болох боловч хөдөлмөрийн зардлыг бууруулахын тулд үүнийг ихэвчлэн үл тоомсорлодог.

Microsoft Office-ийн Excel эсвэл Open Office-ийн Calc гэх мэт оффисын багцын хүснэгтээс санах ойг ашиглан өгөгдлийг буулгаж болно. Энэ зорилгоор хүснэгтхуулах өгөгдлийн хүрээг тодруулж, санах ой руу хуулж, энэ хуудасны өгөгдлийн талбарт өгөгдлийг буулгана уу.

Хамгийн бага квадратын аргыг ашиглан тооцоолохын тулд "b" гэсэн хоёр коэффициентийг тодорхойлохын тулд дор хаяж хоёр цэг шаардлагатай - шугамын налуу өнцгийн тангенс ба "a" - "y" тэнхлэг дээрх шугамаар таслагдсан утга.

Тооцоолсон регрессийн коэффициентүүдийн алдааг тооцоолохын тулд туршилтын цэгүүдийн тоог хоёроос дээш болгох шаардлагатай.

Хамгийн бага квадратын арга (LSM).

Туршилтын цэгүүдийн тоо их байх тусам илүү нарийвчлалтай болно статистик үнэлгээкоэффициентүүд (Студентийн коэффициент буурсантай холбоотой) ба тооцоолол нь ерөнхий түүврийн тооцоонд ойртох тусам.

Туршилтын цэг бүрт үнэ цэнийг олж авах нь ихэвчлэн их хэмжээний хөдөлмөрийн зардалтай холбоотой байдаг тул зохицуулалттай тооцооллыг өгдөг бөгөөд хэт их хөдөлмөрийн зардалд хүргэдэггүй олон тооны туршилтуудыг хийдэг. Дүрмээр бол хоёр коэффициент бүхий шугаман хамгийн бага квадратын хамаарлын туршилтын цэгүүдийн тоог 5-7 цэгийн бүсэд сонгоно.

Шугаман харилцааны хамгийн бага квадратуудын товч онол

Бидэнд хос утгын [`y_i`, `x_i`] хэлбэрийн туршилтын өгөгдлийн багц байна гэж бодъё, энд `i` нь 1-ээс `n` хүртэлх туршилтын нэг хэмжилтийн тоо; `y_i` - `i` цэг дээрх хэмжсэн хэмжигдэхүүний утга; `x_i` - `i` цэг дээр бидний тохируулсан параметрийн утга.

Жишээ болгон Ом хуулийн үйл ажиллагааг авч үзье. Цахилгаан хэлхээний хэсгүүдийн хоорондох хүчдэлийг (боломжийн зөрүү) өөрчилснөөр бид энэ хэсгийг дамжин өнгөрөх гүйдлийн хэмжээг хэмждэг. Физик бидэнд туршилтаар олдсон хамаарлыг өгдөг.

`I = U/R`,
энд "би" нь одоогийн хүч юм; `R` - эсэргүүцэл; `U` - хүчдэл.

Энэ тохиолдолд `y_i` нь хэмжсэн гүйдлийн утга, `x_i` нь хүчдэлийн утга юм.

Өөр нэг жишээ болгон, уусмал дахь бодисын уусмал гэрлийн шингээлтийг авч үзье. Хими бидэнд дараах томъёог өгдөг.

`A = ε l C`,
Энд `A` нь уусмалын оптик нягт; `ε` - ууссан бодисын дамжуулалт; `l` - уусмал бүхий кюветтээр гэрэл өнгөрөх үед замын урт; `C` нь ууссан бодисын концентраци юм.

Энэ тохиолдолд 'y_i' нь 'A' оптик нягтын хэмжсэн утга бөгөөд 'x_i' нь бидний тодорхойлсон бодисын концентрацийн утга юм.

`x_i` үзүүлэлтийн харьцангуй алдаа нь `y_i` хэмжилтийн харьцангуй алдаанаас хамаагүй бага байх тохиолдлыг бид авч үзэх болно. Бид мөн бүх хэмжсэн утгууд 'y_i' санамсаргүй бөгөөд хэвийн тархалттай байна, өөрөөр хэлбэл. хэвийн тархалтын хуулийг дагаж мөрдөх.

`y`-ийн `x`-ээс шугаман хамаарлын хувьд онолын хамаарлыг дараах байдлаар бичиж болно.
`y = a + b x`.

Геометрийн үүднээс авч үзвэл `b` коэффициент нь шугамын `x` тэнхлэгт налуу өнцгийн шүргэгчийг, `a` коэффициент нь шугамын огтлолцлын цэг дэх `y` утгыг илэрхийлнэ. `y` тэнхлэгтэй шугам (`x = 0` үед).

Регрессийн шугамын параметрүүдийг олох.

Туршилтын хувьд хэмжилтийн алдаанаас болж 'y_i' хэмжсэн утгууд нь онолын шулуун шугам дээр яг хэвтэж чадахгүй бөгөөд энэ нь үргэлж өвөрмөц байдаг. бодит амьдрал. Тиймээс шугаман тэгшитгэлийг тэгшитгэлийн системээр илэрхийлэх ёстой.
`y_i = a + b x_i + ε_i` (1),
Энд `ε_i` нь `i`-р туршилтын `y` хэмжилтийн үл мэдэгдэх алдаа юм.

Хамаарал (1)-ийг мөн нэрлэдэг регресс, өөрөөр хэлбэл статистикийн ач холбогдолтой хоёр хэмжигдэхүүн бие биенээсээ хамаарах хамаарал.

Хараат байдлыг сэргээх ажил нь туршилтын цэгүүдээс [`y_i`, `x_i`] `a` ба `b` коэффициентүүдийг олох явдал юм.

"a" ба "b" коэффициентийг олохын тулд үүнийг ихэвчлэн ашигладаг хамгийн бага квадратын арга(MNC). Энэ нь хамгийн их магадлалын зарчмын онцгой тохиолдол юм.

(1)-ийг `ε_i = y_i - a - b x_i` хэлбэрээр дахин бичье.

Дараа нь квадрат алдааны нийлбэр болно
`Φ = нийлбэр_(i=1)^(n) ε_i^2 = нийлбэр_(i=1)^(n) (y_i - a - b x_i)^2`. (2)

Хамгийн бага квадратуудын (хамгийн бага квадрат) зарчим нь `a` ба `b` параметрүүдийн нийлбэрийг (2) багасгах явдал юм..

`a` ба `b` коэффициентүүдийн нийлбэр (2) хэсэгчилсэн деривативууд тэгтэй тэнцүү байх үед хамгийн багадаа хүрнэ.
`frac(хэсэгчилсэн Φ)(хэсэг a) = frac(хэсэгчилсэн нийлбэр_(i=1)^(n) (y_i - a - b x_i)^2)(хэсэг a) = 0`
`frac(хэсэгчилсэн Φ)(хэсэг b) = frac(хэсэгчилсэн нийлбэр_(i=1)^(n) (y_i - a - b x_i)^2)(хэсэг b) = 0`

Деривативуудыг өргөжүүлснээр бид хоёр үл мэдэгдэх хоёр тэгшитгэлийн системийг олж авна.
`нийлбэр_(i=1)^(n) (2a + 2bx_i — 2y_i) = нийлбэр_(i=1)^(n) (a + bx_i — y_i) = 0`
`нийлбэр_(i=1)^(n) (2bx_i^2 + 2ax_i — 2x_iy_i) = нийлбэр_(i=1)^(n) (bx_i^2 + ax_i — x_iy_i) = 0`

Бид хаалтуудыг нээж, шаардлагатай коэффициентээс хамааралгүй нийлбэрүүдийг нөгөө хагаст шилжүүлж, шугаман тэгшитгэлийн системийг олж авна.
`нийлбэр_(i=1)^(n) y_i = a n + b нийлбэр_(i=1)^(n) bx_i`
`нийлбэр_(i=1)^(n) x_iy_i = a нийлбэр_(i=1)^(n) x_i + b нийлбэр_(i=1)^(n) x_i^2`

Үүссэн системийг шийдэж, бид "a" ба "b" коэффициентүүдийн томъёог олно.

`a = фрак(нийлбэр_(i=1)^(n) y_i нийлбэр_(i=1)^(n) x_i^2 — нийлбэр_(i=1)^(n) x_i нийлбэр_(i=1)^(n ) x_iy_i) (n нийлбэр_(i=1)^(n) x_i^2 — (нийлбэр_(i=1)^(n) x_i)^2)` (3.1)

`b = фрак(n нийлбэр_(i=1)^(n) x_iy_i — нийлбэр_(i=1)^(n) x_i нийлбэр_(i=1)^(n) y_i) (n нийлбэр_(i=1)^ (n) x_i^2 — (нийлбэр_(i=1)^(n) x_i)^2)` (3.2)

Эдгээр томьёо нь `n > 1` (дор хаяж 2 цэг ашиглан шугамыг барьж болно) болон тодорхойлогч `D = n нийлбэр_(i=1)^(n) x_i^2 - (нийлбэр_(i= 1) үед шийдлүүдтэй байна. )^(n) x_i)^2 != 0`, i.e. Туршилтын `x_i` цэгүүд өөр байх үед (жишээ нь шугам босоо биш үед).

Регрессийн шугамын коэффициентүүдийн алдааны тооцоо

"a" ба "b" коэффициентийг тооцоолоход гарсан алдааг илүү нарийвчлалтай үнэлэхийн тулд үүнийг хийх нь зүйтэй юм. их тоотуршилтын цэгүүд. `n = 2` үед коэффициентүүдийн алдааг тооцоолох боломжгүй, учир нь Ойролцоо шугам нь хоёр цэгээр давтагдашгүй өнгөрнө.

`V` санамсаргүй хэмжигдэхүүний алдааг тодорхойлно алдааны хуримтлалын хууль
`S_V^2 = нийлбэр_(i=1)^p (фрак(хэсэг f)(хэсэг z_i))^2 S_(z_i)^2`,
Энд `p` нь `S_(z_i)` алдаатай `z_i` параметрүүдийн тоо бөгөөд `S_V` алдаанд нөлөөлдөг;
`f` нь `V`-ийн `z_i`-ээс хамаарах функц юм.

`a` ба `b` коэффициентүүдийн алдааны алдааны хуримтлалын хуулийг бичье.
`S_a^2 = нийлбэр_(i=1)^(n)(фрак(хэсэг а)(хэсэг y_i))^2 S_(y_i)^2 + нийлбэр_(i=1)^(n)(фрак(хэсэг а) )(хэсэгчилсэн x_i))^2 S_(x_i)^2 = S_y^2 нийлбэр_(i=1)^(n)(frac(хэсэг а)(хэсэг y_i))^2 `,
`S_b^2 = нийлбэр_(i=1)^(n)(фрак(хэсэг b)(хэсэг y_i))^2 S_(y_i)^2 + нийлбэр_(i=1)^(n)(фрак(хэсэг b) )(хэсэгчилсэн x_i))^2 S_(x_i)^2 = S_y^2 нийлбэр_(i=1)^(n)(frac(хэсэг b)(хэсэг y_i))^2 `,
учир нь `S_(x_i)^2 = 0` (бид өмнө нь `x` алдаа маш бага байна гэж тэмдэглэсэн).

`S_y^2 = S_(y_i)^2` - `y`-ийн бүх утгын хувьд алдаа нь жигд байна гэж үзвэл `y`-ийн хэмжилтийн алдаа (варианц, квадрат стандарт хазайлт).

`a` болон `b`-г тооцоолох томьёог орлуулснаар бид олж авсан илэрхийлэлд орно.

`S_a^2 = S_y^2 фрак(нийлбэр_(i=1)^(n) (нийлбэр_(i=1)^(n) x_i^2 — x_i нийлбэр_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 фрак((n нийлбэр_(i=1)^(n) x_i^2 — (нийлбэр_(i=1)^(n) x_i)^2) нийлбэр_(i=1) ^(n) x_i^2) (D^2) = S_y^2 фрак(нийлбэр_(i=1)^(n) x_i^2) (D)` (4.1)

`S_b^2 = S_y^2 фрак(нийлбэр_(и=1)^(n) (n x_i — нийлбэр_(i=1)^(n) x_i)^2) (D^2) = S_y^2 фрак( n (n нийлбэр_(i=1)^(n) x_i^2 — (нийлбэр_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 фрак(n) (D) ` (4.2)

Ихэнх бодит туршилтуудад `Sy`-ийн утгыг хэмждэггүй. Үүнийг хийхийн тулд төлөвлөгөөний нэг буюу хэд хэдэн цэг дээр хэд хэдэн зэрэгцээ хэмжилт (туршилт) хийх шаардлагатай бөгөөд энэ нь туршилтын хугацааг (болон магадгүй зардлыг) нэмэгдүүлдэг. Тиймээс регрессийн шугамаас `y`-ийн хазайлтыг санамсаргүй гэж үзэж болно гэж ихэвчлэн үздэг. Энэ тохиолдолд 'y' хэлбэлзлийн тооцоог томъёогоор тооцоолно.

`S_y^2 = S_(y, амралт)^2 = фрак(нийлбэр_(i=1)^n (y_i - a - b x_i)^2) (n-2)`.

Туршилтын ижил түүврийг ашиглан хоёр коэффициентийг тооцоолсны улмаас бидний эрх чөлөөний зэрэглэлийн тоо багассан тул `n-2` хуваагч гарч ирнэ.

Энэ тооцоог мөн `S_(y, амралт)^2` регрессийн шугамтай харьцуулахад үлдэгдэл дисперс гэж нэрлэдэг.

Коэффициентийн ач холбогдлыг Оюутны t тест ашиглан үнэлдэг

`t_a = frac(|a|) (S_a)`, `t_b = frac(|b|) (S_b)`

Хэрэв тооцоолсон `t_a`, `t_b` шалгуур үзүүлэлтүүд нь хүснэгтэд үзүүлсэн `t(P, n-2)` шалгуураас бага байвал харгалзах коэффициент нь өгөгдсөн `P` магадлалаар тэгээс мэдэгдэхүйц ялгаатай биш гэж үзнэ.

Шугаман харилцааны тодорхойлолтын чанарыг үнэлэхийн тулд та Фишерийн шалгуурыг ашиглан `S_(y, амралт)^2` ба `S_(bar y)`-ийг дундажтай харьцуулж болно.

`S_(бар y) = фрак(нийлбэр_(i=1)^n (y_i — багана у)^2) (n-1) = фрак(нийлбэр_(i=1)^n (y_i — (нийлбэр_(i=) 1)^n y_i) /n)^2) (n-1)` - дундажтай харьцуулахад `y` дисперсийн түүврийн тооцоо.

Хамааралтай байдлыг тодорхойлох регрессийн тэгшитгэлийн үр нөлөөг үнэлэхийн тулд Фишерийн коэффициентийг тооцоолно.
`F = S_(бар y) / S_(y, амрах)^2`,
Үүнийг хүснэгтийн Фишерийн коэффициент `F(p, n-1, n-2)`-тай харьцуулсан.

Хэрэв `F > F(P, n-1, n-2)` бол `y = f(x)` хамаарлыг регрессийн тэгшитгэл ашиглан тайлбарлах ба дундаж утгыг ашигласан тайлбарын хоорондох зөрүүг магадлалын хувьд статистикийн хувьд ач холбогдолтой гэж үзнэ. `P`. Тэдгээр. регресс нь дундаж утгын эргэн тойронд "y"-ийн тархалтаас хамаарлыг илүү сайн тодорхойлдог.

График дээр дарна уу
хүснэгтэд утгыг нэмэх

Хамгийн бага квадратын арга. Хамгийн бага квадратын арга гэдэг нь үл мэдэгдэх параметрүүдийг a, b, c, хүлээн зөвшөөрөгдсөн функциональ хамаарлыг тодорхойлохыг хэлнэ.

Хамгийн бага квадратын арга нь үл мэдэгдэх параметрүүдийг тодорхойлоход хамаарна a, b, c,…хүлээн зөвшөөрөгдсөн функциональ хамаарал

у = f(x,a,b,c,…),

Энэ нь алдааны дундаж квадратын (дисвэрийн) хамгийн бага хэмжээг өгөх болно

, (24)

Энд x i, y i нь туршилтаас олж авсан хос тоонуудын багц юм.

Хэд хэдэн хувьсагчийн функцийн экстремумын нөхцөл нь түүний хэсэгчилсэн дериватив нь тэгтэй тэнцүү байх нөхцөл байдаг тул параметрүүд нь a, b, c,…тэгшитгэлийн системээр тодорхойлогддог.

; ; ; … (25)

Функцийн төрлөөс хойш параметрүүдийг сонгохдоо хамгийн бага квадратын аргыг ашигладаг гэдгийг санах нь зүйтэй у = f(x)тодорхойлсон

Хэрэв онолын үүднээс авч үзвэл эмпирик томъёо нь ямар байх ёстой талаар ямар ч дүгнэлт хийх боломжгүй бол харааны дүрслэл, юуны түрүүнд ажиглагдсан өгөгдлийн график дүрслэлийг удирдан чиглүүлэх шаардлагатай.

Практикт тэдгээр нь ихэвчлэн хязгаарлагдмал байдаг дараах төрлүүдфункцууд:

1) шугаман ;

2) квадрат a.