Простой вопрос — вот, например, у меня есть линейная регрессия для y=f(x)
f1 = lm(data)
Вопрос, как мне узнать x для интересующего меня y? Я тупо не могу понять, по каким ключевым словам гуглить :)
Более сложный — скажем, есть логарифмическая зависимость IC от C. Можно считать, что смертность бактерий в зависимости от концентрации яда. Что-то типа:
C, IC
1, 0.6
0.1, 0.3
0.01, 0.2
0.001, 0.03
0.0001, 0.06
Требуется пробит-регрессией определить IC50, т.е. концентрацию, при которой дохнет половина. Типа LD50.
Тут я полный ноль и в этой регрессии и в R. Чистый обезьяний метод даёт такое:
>d3=read.csv("test3.csv");
>g3 = glm(IC~C,data=d3,family=quasibinomial(link=probit))
>require(MASS)
>dose.p(g3,cf=1:2,p=0.5)
Dose SE
p = 0.5: 0.7905077 0.229242
«Петька, приборы? — 600? — Что 600? — А что приборы?»
0.79 — это точно IC50 в данном случае? На порядок похоже. Но сильно смахивает на результат линейной аппроксимации. А она тут, похоже, логарифмическая. Если подсунуть логарифмы концентрации:
>g3 = glm(IC~log(C),data=d3,family=quasibinomial(link=probit))
> dose.p(g3,cf=1:2,p=0.5)
Dose SE
p = 0.5: -0.6072992 0.7458894
> exp(-0.6072992)
[1] 0.5448203
Выходит 0.54 — это, возможно, ближе к истине. Но я уже абсолютно оторван от понимания происходящих в потрохах процессов :)
Может кто-то прокомментировать?