The PDF file of this paper is in Russian.
The article considers the possibility of applying time series analysis in the oil industry. A model of Seasonal Auto Regression Integrated Moving Average with external variables (SARIMAX) for medium-term forecasting (up to 1 year) of integrated oil production in oil fields is built. As a training sample, monthly data on oil production for 10 years of development of several fields of Rosneft PJSC have been studied; monthly data on the number of producing wells were used as an exogenous variable. As a result of the consistent application of the extended Dickey-Fuller test to the time series, the first order of integration of the random process was substantiated. The correctness of the inclusion of an exogenous variable in the model was confirmed by testing the hypothesis of the presence of co-integration between the variables of oil production and the number of producing wells. The analysis of the autocorrelation and private autocorrelation functions of the studied time series for oil production, as well as the selection of models based on the Akayke and Schwartz information criteria, made it possible to determine the best specification of the SARIMAX model. The obtained forecast values were checked against the actual values of oil production at the field. Based on the predicted and actual values, the model quality metrics have been calculated: the average approximation error (MAPE) was 0.78%. The application of the methodology for predicting oil production proposed in the article and the use of the accumulated volume of data in a structured form led to a qualitative forecast. This, in turn, will allow in the future making more informed business decisions, since a high-quality medium-term forecast allows you to save company resources.
В статье рассмотрена возможность применения анализа временных рядов в нефтяной индустрии. Построена модель сезонной авторегрессии скользящего среднего с экзогенными переменными (SARIMAX) для среднесрочного прогнозирования (до 1 года) интегральной добычи нефти на нефтяных месторождениях. В качестве обучающей выборки исследованы ежемесячные данные о добыче нефти за 10 лет разработки нескольких месторождений ПАО «НК «Роснефть», в качестве экзогенной переменной использованы ежемесячные данные о числе добывающих скважин. В результате последовательного применения расширенного теста Дики – Фуллера к временному ряду обоснован первый порядок интеграции случайного процесса. Корректность включения в модель экзогенной переменной подтверждена проверкой гипотезы о наличии коинтеграции между переменными добычи нефти и числом добывающих скважин. Анализ автокорреляционной и частной автокорреляционной функций исследуемых временных рядов о добыче нефти, а также селекция моделей на основе информационных критериев Акайке и Шварца позволила выбрать лучшую спецификацию SARIMAX-модели. Полученные прогнозные значения сверялись с фактической добычей нефти на месторождении. На основе прогнозных и фактических значений рассчитаны метрики качества модели: средняя ошибка аппроксимации (MAPE) составила 0,78 %. Применение предложенной в статье методики прогнозирования добычи нефти и использование накопленного объема данных в структурированном виде позволило получить качественный прогноз. Это в свою очередь даст возможность в будущем принимать более обоснованные бизнес-решения, так как качественный среднесрочный прогноз позволяет экономить ресурсы компании.