Как смоделировать недостающие данные? Имеется большой массив данных, а именно данные снятые с датчиков. В БД некоторые ячейки данных пустые. Какие есть методы дополнения недостающих данных на основе существующих? Может в екселе есть готовые решения? P.S. усредненные значения на основе существующих данных не подходят ибо все это в конечном итоге загоняется в нейронку, а она сразу видит подобное и выдает "мол не хорошо средние значения брать"
Есть несколько методов, которые можно использовать для заполнения недостающих данных на основе существующих:
Интерполяция: этот метод можно использовать, если данные изменяются плавно. Интерполяция позволяет оценить пропущенные значения на основе близлежащих известных данных.
Экстраполяция: если данные имеют тенденцию к постепенному изменению, можно использовать экстраполяцию, чтобы оценить недостающие данные на основе уже имеющихся.
Метод k-ближайших соседей: этот метод основан на сравнении набора данных с соседними значениями и присвоении недостающих данных на основе ближайших соседей.
Прогнозирование временных рядов: если у вас есть временные данные, можно использовать методы прогнозирования временных рядов, такие как ARIMA или SARIMA, чтобы заполнить недостающие данные.
В Excel можно использовать функции, такие как VLOOKUP, INDEX MATCH, IFERROR и другие, чтобы создать формулы для обработки недостающих данных. Однако, для более сложных методов может потребоваться использование специализированного программного обеспечения, такого как Python (с библиотеками pandas и scikit-learn) или R.
Есть несколько методов, которые можно использовать для заполнения недостающих данных на основе существующих:
Интерполяция: этот метод можно использовать, если данные изменяются плавно. Интерполяция позволяет оценить пропущенные значения на основе близлежащих известных данных.
Экстраполяция: если данные имеют тенденцию к постепенному изменению, можно использовать экстраполяцию, чтобы оценить недостающие данные на основе уже имеющихся.
Метод k-ближайших соседей: этот метод основан на сравнении набора данных с соседними значениями и присвоении недостающих данных на основе ближайших соседей.
Прогнозирование временных рядов: если у вас есть временные данные, можно использовать методы прогнозирования временных рядов, такие как ARIMA или SARIMA, чтобы заполнить недостающие данные.
В Excel можно использовать функции, такие как VLOOKUP, INDEX MATCH, IFERROR и другие, чтобы создать формулы для обработки недостающих данных. Однако, для более сложных методов может потребоваться использование специализированного программного обеспечения, такого как Python (с библиотеками pandas и scikit-learn) или R.