Média móvel Este exemplo ensina como calcular a média móvel de uma série temporal no Excel. Uma média móvel é usada para suavizar irregularidades (picos e vales) para reconhecer facilmente as tendências. 1. Primeiro, vamos dar uma olhada em nossa série de tempo. 2. No separador Dados, clique em Análise de dados. Nota: não é possível encontrar o botão Análise de dados Clique aqui para carregar o suplemento do Analysis ToolPak. 3. Selecione Média móvel e clique em OK. 4. Clique na caixa Input Range e selecione o intervalo B2: M2. 5. Clique na caixa Intervalo e escreva 6. 6. Clique na caixa Output Range e seleccione a célula B3. 8. Faça um gráfico destes valores. Explicação: porque definimos o intervalo como 6, a média móvel é a média dos 5 pontos de dados anteriores eo ponto de dados atual. Como resultado, os picos e vales são suavizados. O gráfico mostra uma tendência crescente. O Excel não consegue calcular a média móvel para os primeiros 5 pontos de dados porque não existem pontos de dados anteriores suficientes. 9. Repita os passos 2 a 8 para intervalo 2 e intervalo 4. Conclusão: Quanto maior o intervalo, mais os picos e vales são suavizados. Quanto menor o intervalo, mais próximas as médias móveis são para os pontos de dados reais. Como você pode imaginar, estamos olhando para algumas das abordagens mais primitivas para a previsão. Mas espero que estas sejam pelo menos uma introdução que vale a pena para algumas das questões de computação relacionadas com a implementação de previsões em planilhas. Neste sentido, vamos continuar a partir do início e começar a trabalhar com previsões de média móvel. Previsões médias móveis. Todo mundo está familiarizado com as previsões de média móvel, independentemente de eles acreditam que são. Todos os estudantes universitários fazê-los o tempo todo. Pense nos seus resultados de teste em um curso onde você vai ter quatro testes durante o semestre. Vamos supor que você tem um 85 em seu primeiro teste. O que você poderia prever para sua pontuação do segundo teste O que você acha que seu professor iria prever para a sua próxima pontuação de teste O que você acha que seus amigos podem prever para a sua próxima pontuação de teste O que você acha que seus pais podem prever para a sua próxima pontuação de teste Todo o blabbing você pôde fazer a seus amigos e pais, eles e seu professor são muito prováveis esperar que você comece algo na área dos 85 você apenas começ. Bem, agora vamos supor que, apesar de sua auto-promoção para seus amigos, você superestimar-se e figura que você pode estudar menos para o segundo teste e assim você começa um 73. Agora o que são todos os interessados e despreocupado vai Antecipar você vai chegar em seu terceiro teste Existem duas abordagens muito provável para eles desenvolver uma estimativa, independentemente de se eles vão compartilhar com você. Eles podem dizer a si mesmos: "Esse cara está sempre soprando fumaça sobre suas inteligências. Hes que vai obter outro 73 se hes afortunado. Talvez os pais tentem ser mais solidários e dizer: "Bem, até agora você conseguiu um 85 e um 73, então talvez você deva imaginar sobre como obter um (85 73) 2 79. Eu não sei, talvez se você fez menos festas E werent abanando a doninhas em todo o lugar e se você começou a fazer muito mais estudando você poderia obter uma pontuação mais alta. Ambos estas estimativas são, na verdade, a média móvel previsões. O primeiro é usar apenas sua pontuação mais recente para prever o seu desempenho futuro. Isso é chamado de média móvel usando um período de dados. O segundo é também uma previsão média móvel, mas usando dois períodos de dados. Vamos supor que todas essas pessoas rebentando em sua grande mente têm tipo de puto você fora e você decidir fazer bem no terceiro teste para suas próprias razões e colocar uma pontuação mais alta na frente de seus quotalliesquot. Você toma o teste e sua pontuação é realmente um 89 Todos, incluindo você mesmo, está impressionado. Então agora você tem o teste final do semestre chegando e, como de costume, você sente a necessidade de incitar todos a fazer suas previsões sobre como você vai fazer no último teste. Bem, espero que você veja o padrão. Agora, espero que você possa ver o padrão. Qual você acha que é o apito mais preciso enquanto trabalhamos. Agora vamos voltar para a nossa nova empresa de limpeza iniciada por sua meia irmã distante chamado Whistle While We Work. Você tem alguns dados de vendas anteriores representados pela seção a seguir de uma planilha. Primeiro, apresentamos os dados para uma previsão média móvel de três períodos. A entrada para a célula C6 deve ser Agora você pode copiar esta fórmula de célula para baixo para as outras células C7 a C11. Observe como a média se move sobre os dados históricos mais recentes, mas usa exatamente os três períodos mais recentes disponíveis para cada previsão. Você também deve notar que nós realmente não precisamos fazer as previsões para os períodos passados, a fim de desenvolver a nossa previsão mais recente. Isso é definitivamente diferente do modelo de suavização exponencial. Ive incluído o quotpast previsões porque nós vamos usá-los na próxima página da web para medir a previsão de validade. Agora eu quero apresentar os resultados análogos para uma previsão média móvel de dois períodos. A entrada para a célula C5 deve ser Agora você pode copiar esta fórmula de célula para baixo para as outras células C6 a C11. Observe como agora apenas as duas mais recentes peças de dados históricos são usados para cada previsão. Mais uma vez eu incluí as previsões quotpast para fins ilustrativos e para uso posterior na validação de previsão. Algumas outras coisas que são de importância notar. Para uma previsão média móvel de m-período, apenas os m valores de dados mais recentes são usados para fazer a previsão. Nada mais é necessário. Para uma previsão média móvel do período m, ao fazer previsões quotpast, observe que a primeira predição ocorre no período m 1. Ambas as questões serão muito significativas quando desenvolvemos nosso código. Desenvolvendo a função de média móvel. Agora precisamos desenvolver o código para a previsão da média móvel que pode ser usado de forma mais flexível. O código segue. Observe que as entradas são para o número de períodos que você deseja usar na previsão ea matriz de valores históricos. Você pode armazená-lo em qualquer pasta de trabalho que você deseja. Função MovingAverage (Histórico, NumberOfPeriods) Como Único Declarar e inicializar variáveis Dim Item Como Variante Dim Counter Como Inteiro Dim Acumulação como Único Dim HistoricalSize As Inteiro Inicializando variáveis Counter 1 Acumulação 0 Determinando o tamanho da Historical array HistoricalSize Historical. Count For Counter 1 To NumberOfPeriods Acumulando o número apropriado dos valores mais recentes anteriormente observados Acumulação Acumulação Histórico (HistoricalSize - NumberOfPeriods Counter) MovingAverage Acumulação NumberOfPeriods O código será explicado na classe. Você quer posicionar a função na planilha para que o resultado da computação apareça onde ele deve gostar do seguinte. O ADX inclui algumas funções de agregação estatística, como média, variância e desvio padrão. Outros cálculos estatísticos típicos exigem que você escreva expressões DAX mais longas. Excel, deste ponto de vista, tem uma linguagem muito mais rica. Os Padrões Estatísticos são uma coleção de cálculos estatísticos comuns: mediana, modo, média móvel, percentil e quartil. Gostaríamos de agradecer a Colin Banfield, Gerard Brueckl e Javier Guilln, cujos blogs inspiraram alguns dos seguintes padrões. Exemplo de padrão básico As fórmulas neste padrão são as soluções para cálculos estatísticos específicos. Você pode usar funções padrão DAX para calcular a média (média aritmética) de um conjunto de valores. MÉDIA . Retorna a média de todos os números em uma coluna numérica. AVERAGEA. Retorna a média de todos os números em uma coluna, manipulando texto e valores não numéricos (valores de texto não-numérico e vazio são contados como 0). AVERAGEX. Calcular a média de uma expressão avaliada sobre uma tabela. Média móvel A média móvel é um cálculo para analisar pontos de dados, criando uma série de médias de diferentes subconjuntos do conjunto de dados completo. Você pode usar muitas técnicas DAX para implementar esse cálculo. A técnica mais simples é usar AVERAGEX, iterando uma tabela da granularidade desejada e calculando para cada iteração a expressão que gera o único ponto de dados a ser usado na média. Por exemplo, a fórmula a seguir calcula a média móvel dos últimos 7 dias, supondo que você está usando uma tabela Data no seu modelo de dados. Usando AVERAGEX, você calcula automaticamente a medida em cada nível de granularidade. Ao usar uma medida que pode ser agregada (como SUM), então outra abordagem baseada em CALCULATE pode ser mais rápida. Você pode encontrar essa abordagem alternativa no padrão completo de Moving Average. Você pode usar funções padrão DAX para calcular a variação de um conjunto de valores. VAR. S. Retorna a variância de valores em uma coluna que representa uma população de amostra. VAR. P. Retorna a variância de valores em uma coluna que representa toda a população. VARX. S. Retorna a variância de uma expressão avaliada sobre uma tabela representando uma população de amostra. VARX. P. Retorna a variância de uma expressão avaliada sobre uma tabela representando a população inteira. Desvio padrão Você pode usar funções DAX padrão para calcular o desvio padrão de um conjunto de valores. STDEV. S. Retorna o desvio padrão de valores em uma coluna que representa uma população de amostra. STDEV. P. Retorna o desvio padrão de valores em uma coluna que representa toda a população. STDEVX. S. Retorna o desvio padrão de uma expressão avaliada sobre uma tabela representando uma população de amostra. STDEVX. P. Retorna o desvio padrão de uma expressão avaliada sobre uma tabela representando a população inteira. A mediana é o valor numérico que separa a metade superior de uma população da metade inferior. Se houver um número ímpar de linhas, a mediana é o valor médio (ordenando as linhas do valor mais baixo ao valor mais alto). Se houver um número par de linhas, é a média dos dois valores médios. A fórmula ignora valores em branco, que não são considerados parte da população. O resultado é idêntico à função MEDIAN no Excel. A Figura 1 mostra uma comparação entre o resultado retornado pelo Excel ea fórmula DAX correspondente para o cálculo da mediana. Figura 1 Exemplo de cálculo mediano em Excel e DAX. O modo é o valor que aparece mais frequentemente em um conjunto de dados. A fórmula ignora valores em branco, que não são considerados parte da população. O resultado é idêntico às funções MODE e MODE. SNGL no Excel, que retornam apenas o valor mínimo quando existem vários modos no conjunto de valores considerados. A função Excel MODE. MULT retornaria todos os modos, mas você não pode implementá-lo como uma medida no DAX. A Figura 2 compara o resultado retornado pelo Excel com a fórmula DAX correspondente para o cálculo de modo. Figura 2 Exemplo de cálculo de modo em Excel e DAX. Percentil O percentil é o valor abaixo do qual uma dada porcentagem de valores em um grupo cai. A fórmula ignora valores em branco, que não são considerados parte da população. O cálculo no DAX requer várias etapas, descritas na seção Padrão completo, que mostra como obter os mesmos resultados das funções Excel PERCENTILE, PERCENTILE. INC e PERCENTILE. EXC. Os quartis são três pontos que dividem um conjunto de valores em quatro grupos iguais, cada grupo compreendendo um quarto dos dados. Você pode calcular os quartis usando o padrão Percentile, seguindo estas correspondências: Primeiro quartil quartil inferior 25º percentil Segundo quartil mediano 50º percentil Terceiro quartil quartil superior 75 percentil Padrão Completo Alguns cálculos estatísticos têm uma descrição mais longa do padrão completo, porque Você pode ter diferentes implementações dependendo de modelos de dados e outros requisitos. Média móvel Geralmente, você avalia a média móvel referenciando o nível de granularidade do dia. O modelo geral da seguinte fórmula tem estes marcadores: ltnumberofdaysgt é o número de dias para a média móvel. Ltdatecolumngt é a coluna de data da tabela de datas se você tiver uma ou a coluna de data da tabela contendo valores se não houver tabela de datas separada. Ltmeasuregt é a medida a calcular como a média móvel. O padrão mais simples usa a função AVERAGEX no DAX, que automaticamente considera apenas os dias para os quais há um valor. Como alternativa, você pode usar o modelo a seguir em modelos de dados sem uma tabela de datas e com uma medida que pode ser agregada (como SUM) durante todo o período considerado. A fórmula anterior considera um dia sem dados correspondentes como uma medida que tem 0 valor. Isso pode acontecer somente quando você tiver uma tabela de datas separada, que pode conter dias para os quais não há transações correspondentes. Você pode fixar o denominador para a média usando apenas o número de dias para o qual há transações usando o seguinte padrão, em que: ltfacttablegt é a tabela relacionada à tabela de datas e que contém valores calculados pela medida. Você pode usar as funções DATESBETWEEN ou DATESINPERIOD em vez de FILTER, mas elas funcionam somente em uma tabela de data regular, enquanto que você pode aplicar o padrão descrito acima também para tabelas de datas não-regular e para modelos que não têm uma tabela de datas. Por exemplo, considere os diferentes resultados produzidos pelas duas medidas a seguir. Na Figura 3, você pode ver que não há vendas em 11 de setembro de 2005. No entanto, essa data está incluída na tabela Data, portanto, há 7 dias (de 11 de setembro a 17 de setembro) que têm apenas 6 dias com dados. Figura 3 Exemplo de cálculo da média móvel considerando e ignorando datas sem vendas. A medida Moving Average 7 Days tem um número menor entre 11 de setembro e 17 de setembro, porque considera 11 de setembro como um dia com 0 vendas. Se você quiser ignorar dias sem vendas, use a medida Moving Average 7 Days No Zero. Esta pode ser a abordagem certa quando você tem uma tabela de datas completa, mas você quer ignorar dias sem transações. Usando a fórmula Moving Average 7 Days, o resultado está correto porque AVERAGEX automaticamente considera apenas valores não em branco. Lembre-se de que você pode melhorar o desempenho de uma média móvel, persistindo o valor em uma coluna calculada de uma tabela com a granularidade desejada, como data ou data e produto. No entanto, a abordagem de cálculo dinâmico com uma medida oferece a capacidade de usar um parâmetro para o número de dias da média móvel (por exemplo, substituir ltnumberofdaysgt por uma medida implementando o padrão de Tabela de Parâmetros). A mediana corresponde ao percentil 50, que você pode calcular usando o padrão Percentile. No entanto, o padrão Median permite otimizar e simplificar o cálculo mediano usando uma única medida, em vez das várias medidas exigidas pelo padrão Percentile. Você pode usar essa abordagem ao calcular a mediana dos valores incluídos no ltvaluecolumngt, como mostrado abaixo: Para melhorar o desempenho, você pode querer persistir o valor de uma medida em uma coluna calculada, se você deseja obter a mediana para os resultados de Uma medida no modelo de dados. No entanto, antes de fazer essa otimização, você deve implementar o cálculo MedianX com base no modelo a seguir, usando esses marcadores: ltgranularitytablegt é a tabela que define a granularidade do cálculo. Por exemplo, pode ser a tabela Data se você deseja calcular a mediana de uma medida calculada no nível do dia ou pode ser VALUES (8216DateYearMonth) se você quiser calcular a mediana de uma medida calculada no nível do mês. Ltmeasuregt é a medida a calcular para cada linha de ltgranularitytablegt para o cálculo mediano. Ltmeasuretablegt é a tabela que contém os dados utilizados por ltmeasuregt. Por exemplo, se o ltgranularitytablegt é uma dimensão como 8216Date8217, então o ltmeasuretablegt será 8216Internet Sales8217 contendo a coluna Internet Sales Amount somada pela medida Internet Total Sales. Por exemplo, você pode escrever a mediana de Vendas totais da Internet para todos os clientes no Adventure Works da seguinte maneira: Dica O seguinte padrão: é usado para remover linhas do ltgranularitytablegt que não têm dados correspondentes na seleção atual. É uma maneira mais rápida do que usar a seguinte expressão: No entanto, você pode substituir toda a expressão CALCULATETABLE com apenas ltgranularitytablegt se você quiser considerar valores em branco do ltmeasuregt como 0. O desempenho da fórmula MedianX depende do número de linhas no Tabela iterada e sobre a complexidade da medida. Se o desempenho for ruim, você pode persistir o resultado de ltmeasuregt em uma coluna calculada do lttablegt, mas isso removerá a capacidade de aplicar filtros ao cálculo mediano no momento da consulta. O Percentile Excel tem duas implementações diferentes de cálculo de percentis com três funções: PERCENTILE, PERCENTILE. INC e PERCENTILE. EXC. Todos eles retornam o percentil K de valores, onde K está na faixa de 0 a 1. A diferença é que PERCENTILE e PERCENTILE. INC considerar K como um intervalo inclusivo, enquanto PERCENTILE. EXC considera a gama K 0 a 1 como exclusiva . Todas essas funções e suas implementações DAX recebem um valor percentil como parâmetro, que chamamos de valor de percentil K. ltKgt está na faixa de 0 a 1. As duas implementações DAX de percentil exigem algumas medidas que são semelhantes, mas diferentes o suficiente para exigir Dois conjuntos diferentes de fórmulas. As medidas definidas em cada padrão são: KPerc. O valor percentil corresponde a ltKgt. PercPos. A posição do percentil no conjunto de valores ordenados. ValueLow. O valor abaixo da posição percentil. Valor Alto. O valor acima da posição percentil. Percentil. O cálculo final do percentil. Você precisa das medidas ValueLow e ValueHigh no caso do PercPos contém uma parte decimal, porque então você tem que interpolar entre ValueLow e ValueHigh, a fim de retornar o valor percentil correto. A Figura 4 mostra um exemplo dos cálculos feitos com fórmulas Excel e DAX, usando ambos os algoritmos de percentil (inclusive e exclusivo). Figura 4 Cálculos de percentil usando fórmulas do Excel eo cálculo DAX equivalente. Nas seções a seguir, as fórmulas Percentile executam o cálculo em valores armazenados em uma coluna de tabela, DataValue, enquanto que as fórmulas PercentileX executam o cálculo em valores retornados por uma medida calculada em uma determinada granularidade. Percentile Inclusive A implementação do Percentile Inclusive é a seguinte. Percentile Exclusive A implementação do Percentile Exclusive é a seguinte. PercentileX Inclusive A implementação PercentileX Inclusive é baseada no seguinte modelo, usando esses marcadores: ltgranularitytablegt é a tabela que define a granularidade do cálculo. Por exemplo, pode ser a tabela Data se você quiser calcular o percentil de uma medida no nível do dia ou pode ser VALUES (8216DateYearMonth) se você quiser calcular o percentil de uma medida no nível do mês. Ltmeasuregt é a medida para calcular para cada linha de ltgranularitytablegt para o cálculo do percentil. Ltmeasuretablegt é a tabela que contém os dados utilizados por ltmeasuregt. Por exemplo, se o ltgranularitytablegt é uma dimensão tal como 8216Date, 8217 então o ltmeasuretablegt será 8216Sales8217 contendo a coluna Amount somada pela medida Total Amount. Por exemplo, você pode escrever o PercentileXInc do Valor Total de Vendas para todas as datas na tabela Data da seguinte forma: PercentileX Exclusive A implementação do PercentileX Exclusive é baseada no seguinte modelo, usando os mesmos marcadores usados no PercentileX Inclusive: Por exemplo, você Pode escrever o PercentileXExc do montante total de vendas para todas as datas na tabela Data da seguinte forma: Mantenha-me informado sobre os próximos padrões (newsletter). Desmarque para baixar livremente o arquivo. Publicado em 17 de março de 2014 por
Comments
Post a Comment