[d | an-b-bro-fr-gf-hr-l-m-maid-med-mi-mu-ne-o-old_o-p-ph-r-s-sci-sp-t-tran-tv-w-x | bg-vg | au-mo-tr | a-aa-abe-azu-c-dn-fi-hau-jp-ls-ma-me-rm-sos-tan-to-vn | misc-tenma-vndev | dev-stat]
[Burichan] [Futaba] [Gurochan] [Tomorrow] [Архив-Каталог-RSS] [Главная]

Файл: ke.gif -(0 KB, 25x15, ke.gif)
0 No.33040  

Простой наверное вопрос, для тех, кто подробно изучал теорвер, статистику и ттэ или что-то подобное. Есть набор экспериментальных точек, я хочу описать их полиномом или, скажем, суммой экспонент и тп. И вот я добавляю степень или ввожу дополнительную экспоненту, дисперсия, понятное дело, уменьшается. Есть ли критерий, который более-менее четко позволяет оценить обоснованность добавления лишней степени скажем, уменьшилась на порядок, хорошо, а всего в джва раза — недостаточное основание? Нагуглил равное, но трудно разобраться.

>> No.33043  

Коэффициенты Стьюдента тебе в помощь.
Или я чего-то не пони и ты даже корреляцию не осилил?

>> No.33045  

>>33043
Я ведь про нелинейность спрашиваю. Вот как во втором примере тут
https://en.wikipedia.org/wiki/Correlation_and_dependence#Correlation_and_linearity

>> No.33046  

>>33045
Тогда вообще не понимаю, чем тебя корреляция не устраивает.
Зафигачь во второй пример интерполирующую параболу - R² скаканет до небес.
Или вопрос стоит примерно так: есть инфы на M точек, а хочется интерполировать их полиномом K степени. Или лучше K+1?

>> No.33048  
Файл: pipe.gif -(1 KB, 46x17, pipe.gif)
1

>>33046
Именно. Как выбрать между K и K+1. Тащемта я уже нагуглил http://udel.edu/~mcdonald/statcurvreg.html
и
http://www.r-bloggers.com/polynomial-regression-techniques/
и еще несколько. Но какой-то хендбук не помешал бы.

>> No.33049  

>>33048

>Как выбрать между K и K+1.

Очевидно, "лучше меньше, да лучше". Ведь при K=M корреляция всегда равна 1.

>> No.33051  

>>33049
Ну вот из этих соображений я и сформулировал оп.

>> No.33052  

Если подходить с точки зрения экспериментальной физики, то можно попробовать оттолкнуться от среднего шумового уровня и взять условием, что при выбранном K среднее квадратичное отклонение не должно получаться лучше чем характерное для выбранного уровня шума. Но для этого шум желательно должен быть с известными и постоянными характеристиками, желательно измеренными экспериментально, ну и разумеется экспериментальных точек должно быть много. Наверняка есть статьи с нормальным разбором, но мне сейчас ничего не вспоминается.

>> No.33118  

>>33052
По-моему это задача на чистое использование cross-validation (ну или leave 1 out если у тебя мало точек).

То, что даёт меньшую погрешность на неизвестных данных, то и будет лучше




[d | an-b-bro-fr-gf-hr-l-m-maid-med-mi-mu-ne-o-old_o-p-ph-r-s-sci-sp-t-tran-tv-w-x | bg-vg | au-mo-tr | a-aa-abe-azu-c-dn-fi-hau-jp-ls-ma-me-rm-sos-tan-to-vn | misc-tenma-vndev | dev-stat]
[Burichan] [Futaba] [Gurochan] [Tomorrow] [Архив-Каталог-RSS] [Главная]