{"componentChunkName":"component---src-pages-projects-math-js","path":"/en/projects/math/","result":{"data":{"ru_projects":{"edges":[{"node":{"html":"
Одной из задач, решаемых группой, является популяризация и развитие метода статистической регуляризации, созданного В.Ф. Турчинным в 70-х годах XX века.
\nТипичной некорректной обратной задачей, возникающей в физике, является уравнение Фредгольма I рода:
\nf(y)=a∫bdxK(x,y)φ(x)\nФактически, это уравнение описывает следующее: аппаратная функция прибора K(x,y) действует на иследуемый спектр или иной входной сигнал φ, в результате чего исследователь наблюдает выходной сигнал f(y). Целью исследователя является востановить сигнал φ по известным f(y) и K(x,y). Казалось бы, восстановление сигнала не является сложной задачей, поскольку уравнение Фредгольма имеет точное решение. Но уравение Фредгольма некорректно - бесконечно малое изменение начальных условий приводит к конечному изменению решения. Таким образом, наличие шумов, присутствущих в любом эксперименте, обесценивает попытки решить это уравение точно.
\nРассмотрим некую алгебраизацию уравнения Фредгольма:
\nfm=Kmnφn\nС точки зрения математической статистики мы должны должны оценить φ по реализации f, зная плотность вероятности для f и содержимое матрицы K. Действуя в духе теории принятия решений, мы должны выбрать вектор-функцию S, определяющую φ на основе f и называемую стратегией. Для того, чтобы определить, какие стратегии более оптимальные, мы введем квадратичную функцию потерь:
\nL(φ^,S)=(φ^−S)2,\nгде φ^ — наилучшее решение. Согласно баейсовскому подходу рассмотрим φ как случайную переменную и переместим нашу неопределенность о φ в априорную плотность P(φ), выражающую достоверность различных возможных законов природы и определяемую на основе информации, сущетсвующей до проведения эксперимента. При таком подходе выбор оптимальной стратегии основывается на минимизации апостериорного риска:
\nrS(φ)≡EφEf[L(φ,S)∣φ]\nТогда оптимальная стратегия в случае квадратичной функции потерь хорошо известна:
\nSnopt=E[φn∣f]=∫φnP(φ∣f)dφ\nАпостерионая плотность P(φ∣f) определяется по\nтеореме Баейса:
\nP(φ∣f)=∫dφP(φ)P(f∣φ)P(φ)P(f∣φ)\nКроме того, такой подход позволяет определить дисперсию полученного решения:
\n⟨σn2⟩=∫(φn−Snopt)2P(φ∣f)dφ\nМы получили решение, введя априорную плотность P(φ). Можем ли мы сказать, что-либо о том мире функций φ(x), который задается априорной плотностью? Если ответ на этот вопрос отрицательный, то мы должны будем принять все возможные φ(x) равновероятными и вернуться к нерегуляризованному решению. Таким образом, мы должны ответить на этот вопрос положительно. Именно в этом заключается метод статистической регуляризации — регуляризация решения за счет введения дополнительной априорной информации о φ(x). Если исследователь уже обладает какой-либо априорной информацией (априорной плотностью P(φ)), он может просто вычислить интеграл и получить ответ. В случае, если такой информации нет, в следующем параграфе описывается, какой минимальной информацией может обладать исследователь и как её использовать для получения регулязованного решения.
\nКак показали британские ученые, во всем остальном мире любят дифференцировать. Причем, если математик будет задаваться вопросами о правомерности этой операции, то физик оптимистично верит, что законы природы описываются “хорошим” функциями, то есть гладкими. Иначе говоря, он назначает более гладким φ(x) более высокую априорную плотность вероятности. Так давайте попробуем ввести априорную вероятность, основанную на гладкости. Для этого мы вспомним, что введение априорной иформации — это некоторое насилие над миром, принуждающее законы природы выглядеть удобным для нас образом. Это насилие следует свести к минимуму, и, вводя априорную плотность вероятности, необходимо, что бы информация Шеннона относительно φ(x), содержащаяся в P(φ), была минимальной. Формализуя выше сказанное, выведем вид априорной плотности, основанной на гладкости функции. Для этого мы будем искать условный экстремум информации:
\nI[P(φ)]=∫lnP(φ)P(φ)dφ→min\nПри следующих условиях:
\nВнимательный читатель должен задать вопрос об определении значения параметра ω. Ответ на него будет дан далее по тексту.
\nПри этих условиях доставлять минимум функционалу будет следующая функция:
\nPα(φ)=(2π)N/2αRg(Ω)/2detΩ1/2exp(−21(φ,αΩφ))\nПараметр α cвязан с ω, но поскольку у нас нет собственно информации о конкректных значениях функционала гладкости, выяснять, как именно он связан, бессмысленно. Что же тогда делать с α, спросите вы? Здесь перед вами расрываются три пути:
\nПервый случай нам мало интересен. Во втором случае мы получим следующую формулу для решения:
\n⟨φi⟩=∫dφP(f∣φ)∫dαP(α)α2Rg(Ω)exp(−2α(φ,Ωφ))∫dφφiP(f∣φ)∫dαP(α)α2Rg(Ω)exp(−2α(φ,Ωφ))\nТретий случай будет рассмотрен в следующем разделе на примере гауссовых шумов в эксперименте.
\nСлучай, когда ошибки в эксперименте распределены по Гауссу, замечателен тем, что можно получить аналитическое решение нашей задачи. Решение и его ошибка будут иметь следующий вид:
\nφ=(KTΣ−1K+α∗Ω)−1KTΣ−1Tf\nΣφ=(KTΣ−1K+α∗Ω)−1\nгде Σ - ковариационная матрица многомерного распределения Гаусса, α∗ - наиболее вероятное значение параметра α, которое определяется из условия максимума апостериорной плотности вероятности:
\nP(α∣f)=C39;α2Rg(Ω)∣(KTΣ−1K+αΩ)−1∣exp(21fTΣ−1KT(KTΣ−1K+αΩ)−1KTΣ−1Tf)\nВ качестве примера рассмотрим востановление спектра, состоящего из двух гауссовых пиков, которые попали под действие интегрального ядра-ступеньки (функции Хевисайда).
\n","frontmatter":{"shortTitle":"Обратные задачи","title":"Статистическая регуляризация некорректных обратных задач","id":"deconvolution"}}},{"node":{"html":"\n \n \n \n | \n \n Этот раздел дорабатывается... | \n
One of the tasks solved by the group is the popularization and development of the statistical regularization method created by V.F. Turchin in the 70s of the XX century.
\nA typical incorrect inverse problem that arises in physics is the Fredholm equation of the first kind:
\nf(y)=a∫bdxK(x,y)φ(x)\nIn fact, this equation describes the following: the hardware function of the device K(x,y) acts on the studied spectrum or other input signal φ, as a result, the researcher observes the output signal f(y). The aim of the researcher is to restore the signal φ from the known f(y) and K(x,y). It would seem that signal recovery is not a difficult task, since the Fredholm equation has an exact solution. But the Fredholm equation is incorrect - an infinitesimal change in the initial conditions leads to a final change in the solution. Thus, the presence of noise present in any experiment invalidates attempts to solve this equation for sure.
\nConsider a certain algebraization of the Fredholm equation:
\nfm=Kmnφn\nIn terms of mathematical statistics, we must evaluateφ using implementation f, knowing the probability density for f and matrix K content. Acting in the spirit of decision theory, we must choose a vector function S, defining φ on base of f and called strategy. In order to determine which strategies are more optimal, we introduce the squared loss function:
\nL(φ^,S)=(φ^−S)2,\nwhere φ^ — the best decision. According to the Bayesian approach, we consider φ as random variable and move our uncertainty about φ in prior density P(φ), Expressing reliability of the various possible laws of nature and determined on the basis of information prior to the experiment. With this approach, the choice of an optimal strategy is based on minimizing aposterior risk:
\nrS(φ)≡EφEf[L(φ,S)∣φ]\nThen the optimal strategy in case of the square loss function is well known:
\nSnopt=E[φn∣f]=∫φnP(φ∣f)dφ\nAposterior density P(φ∣f) is determined by the Bayes theorem:
\nP(φ∣f)=∫dφP(φ)P(f∣φ)P(φ)P(f∣φ)\nIn addition, this approach allows us to determine the dispersion of the resulting solution:
\n⟨σn2⟩=∫(φn−Snopt)2P(φ∣f)dφ\nWe got the solution by introducing a priori density P(φ). Can we say anything about the world of φ(x) functions, which is defined by a priori density? If the answer to this question is no, we will have to accept all possible φ(x) equally probable and return to the irregular solution. Thus, we should answer this question positively. This is the statistical regularization method - regularization of the solution by introducing additional a priori information about φ(x). If a researcher already has some a priori information (a priori density of P(φ)), he can simply calculate the integral and get an answer. If there is no such information, the following paragraph describes what minimal information a researcher can have and how to use it to obtain a regularized solution.
\nAs British scientists have shown, the rest of the world likes to differentiate. Moreover, if a mathematician will be asked questions about the validity of this operation, the physicist optimistically believes that the laws of nature are described by \"good\" functions, that is, smooth. In other words, he assigns smoother φ(x) a higher a priori probability density. So let's try to introduce an a priori probability based on smoothness. To do this, we will remember that the introduction of the a priori probability is some kind of violence against the world, forcing the laws of nature to look comfortable for us. This violence should be minimized, and by introducing an a priori probability density, it is necessary that _ Shannon_'s information regarding φ(x) contained in P(φ) be minimal. Formalizing the above, let us derive a type of a priori density based on the smoothness of the function. For this purpose, we will search for a conditional extremum of information:
\nI[P(φ)]=∫lnP(φ)P(φ)dφ→min\nUnder the following conditions:
\nThe attentive reader should ask a question about the definition of ω. The answer to this question will be given further down the text.
\nUnder these conditions, the following function will deliver a minimum to the function:
\nPα(φ)=(2π)N/2αRg(Ω)/2detΩ1/2exp(−21(φ,αΩφ))\nThe α parameter is associated with ω, but since we don't actually have information about the specific values of the smoothness functionality, it makes no sense to find out how it is associated. Then what to do with α, you ask? There are three paths:
\nThe first case is of little interest to us. In the second case, we get the following formula for the solution:
\n⟨φi⟩=∫dφP(f∣φ)∫dαP(α)α2Rg(Ω)exp(−2α(φ,Ωφ))∫dφφiP(f∣φ)∫dαP(α)α2Rg(Ω)exp(−2α(φ,Ωφ))\nThe third case will be considered in the next section using the example of Gaussian noises in an experiment.
\nThe case where the errors in the experiment are Gaussian distributed is remarkable in that an analytical solution to our problem can be obtained. The solution and its error will be as follows:
\nφ=(KTΣ−1K+α∗Ω)−1KTΣ−1Tf\nΣφ=(KTΣ−1K+α∗Ω)−1\nwhere Σ - covariance matrix of a multidimensional Gaussian distribution, α∗ - the most probable value of the parameter α, which is determined from the condition of maximum a posteriori probability density:
\nP(α∣f)=C39;α2Rg(Ω)∣(KTΣ−1K+αΩ)−1∣exp(21fTΣ−1KT(KTΣ−1K+αΩ)−1KTΣ−1Tf)\nAs an example, we consider the reconstruction of a spectrum consisting of two Gaussian peaks that fell under the action of an integral step kernel (Heaviside function).
\n","frontmatter":{"shortTitle":"Inverse problems","title":"Statistical regularization of incorrect inverse problems","id":"deconvolution"}}},{"node":{"html":"\n \n \n \n | \n \n This section is being finalized ... | \n