Listar valores distintos em stata forex




Listar valores distintos em stata forexAVISO: O grupo de consultoria estatistica IDRE estara migrando o site para o WordPress CMS em fevereiro para facilitar a manutencao e criacao de novos conteudos. Algumas de nossas paginas antigas serao removidas ou arquivadas de modo que elas nao serao mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possivel. Bem-vindo ao Instituto de Pesquisas Digitais e Educacao Ajude o Grupo de Consultoria Estatal, dando um presente Notas da Classe Stata Contagem de n para N Introducao A Stata possui duas variaveis ??incorporadas chamadas n e N. N e a notacao Stata para o numero de observacao atual. N e 1 na primeira observacao, 2 no segundo, 3 no terceiro e assim por diante. N e a notacao de Stata para o numero total de observacoes. Vamos ver como n e N funcionam. Como voce pode ver, o ID da variavel contem o numero de observacao que corre de 1 a 7 e nt e o numero total de observacoes, que e 7. Contar com o uso de n e N em conjunto com o comando pode produzir alguns resultados muito uteis. E claro que, para usar o comando por nos, primeiro devemos classificar nossos dados na variavel por. Agora n1 e o numero de observacao dentro de cada grupo e n2 e o numero total de observacoes para cada grupo. Para listar a pontuacao mais baixa para cada grupo, use o seguinte: Para listar a pontuacao mais alta para cada grupo, use o seguinte: Outro uso de n Permite usar n para descobrir se existem numeros de identificacao duplicados nos seguintes dados: As observacoes 6 e 7 tem os mesmos numeros de identificacao e valores de pontuacao diferentes. Encontrando Duplicados Agora, use N para encontrar observacoes duplicadas. Neste exemplo, classificamos as observacoes por todas as variaveis. Em seguida, usamos toda a variavel na instrucao by e configuramos set n igual ao numero total de observacoes que sao identicas. Finalmente, listamos as observacoes para as quais N e maior que 1, identificando as observacoes duplicadas. Se voce tem muitas variaveis ??no conjunto de dados, pode demorar muito tempo para digita-las duas vezes. Podemos fazer uso do curinga para indicar que desejamos usar todas as variaveis. Alem disso, nas versoes mais recentes do Stata, podemos combinar classificar e em uma unica declaracao. Abaixo esta uma versao simplificada do codigo que rendera exatamente os mesmos resultados acima. O conteudo deste site nao deve ser interpretado como um endosso de qualquer site, livro ou produto de software especifico pela Universidade da California. NOTICE: O grupo de consultoria estatistica IDRE estara migrando o site para o WordPress CMS em fevereiro para facilitar Manutencao e criacao de novos conteudos. Algumas de nossas paginas antigas serao removidas ou arquivadas de modo que elas nao serao mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possivel. Bem-vindo ao Instituto de Pesquisas e Educacao Digital Ajude o Grupo de Consultoria Stat ao oferecer um presente FAQ do Stata Como posso detectar observacoes duplicadas Esta FAQ da Stata mostra como verificar se um conjunto de dados tem observacoes duplicadas. Existem dois metodos disponiveis para essa tarefa. O primeiro exemplo usara comandos disponiveis na base Stata. O segundo exemplo usara um programa escrito pelo usuario. Este comando escrito pelo usuario e bom porque cria uma variavel que captura todas as informacoes necessarias para replicar quaisquer observacoes excluidas. Este exemplo usa o conjunto de dados High School e Beyond, que nao possui observacoes duplicadas. Portanto, adicionamos cinco observacoes duplicadas aos dados e, em seguida, usamos o comando duplicado para detectar quais observacoes sao repetidas. Alem disso, para avaliar a sensibilidade do comando, alteramos o valor de uma das observacoes duplicadas. A razao para mudar um valor e imitar o que pode acontecer na pratica, geralmente procuramos casos quotduplicatequot que nao sao inseridos de forma identica no conjunto de dados. No conjunto de dados, o ID da variavel e o identificador de caso exclusivo. Para adicionar as observacoes duplicadas, classificamos os dados por identificacao. Entao duplique as primeiras cinco observacoes (id 1 a 5). Isso leva a 195 unicas e 5 observacoes duplicadas no conjunto de dados. Para o assunto id 1, todos os seus valores sao duplicados, exceto para o seu indice de matematica, um resultado duplicado e definido como 84. Comecamos executando o comando do relatorio duplicado para ver o numero de linhas duplicadas no conjunto de dados. Isto e seguido por id de relatorios duplicados. Que da o numero de linhas replicadas pelas variaveis ??especificadas nesta instancia, temos apenas id. Poderiamos ter usado o comando de exemplos de duplicatas em vez do comando de relatorio duplicado. O comando de exemplos de duplicatas lista um exemplo de cada conjunto duplicado. Claramente, a saida de duplicatas relata e o indice de relatorio duplicado e diferente. A saida do relatorio duplicado mostra o numero de linhas replicadas sobre todas as variaveis. Observe que na duplicata cujo valor mudamos (id1), as duas linhas nao sao tecnicamente as mesmas, e este comando corretamente nao as pegou. O segundo comando duplicar o relatorio id mostra que temos 195 valores de ID exclusivos e cinco ids (excedentes) que aparecem duas vezes cada (copias), o que leva a um total de 10 observacoes questionaveis ??com base em id. Em seguida, listamos as observacoes duplicadas com o comando da lista de duplicatas. Essa lista de duplicatas corresponde a listagem dessas observacoes com linhas duplicadas no entanto, conforme encontrado com o relatorio duplicado. Ele nao identifica as cinco IDs duplicadas. Portanto, nos tentamos id de lista de duplicatas. Agora vemos quais cinco assuntos sao duplicados no entanto, a lista duplicada apenas lista a variavel especificada. Podemos querer listar as outras variaveis ??para ver quais variaveis ??estao causando a diferenca entre a lista de duplicatas e as saidas de ID da lista de duplicacoes. Para ter uma saida como essa, dada pela lista de duplicatas. Usamos o comando tag de duplicatas para criar uma nova dupla variavel que atribua um 1 se o id for duplicado e 0 se aparecer uma vez. Entao, listamos os casos em que a dupla e igual a 1. E evidente que o ID 1 tem valores diferentes nas pontuacoes de matematica nas observacoes duplicadas. Deste modo, seria aconselhavel verificar qual pontuacao, se for o caso, e a correta. Suponhamos que, neste caso, ambos os escores foram incorretos e a pontuacao real foi de 44. Corrimos as pontuacoes e, apos a correcao, os resultados dos duplicados relatam e o id do relatorio duplicado deve coincidir. Agora, podemos usar o comando de soltar duplicado para soltar as observacoes duplicadas. O comando descarta todas as observacoes, exceto a primeira ocorrencia de cada grupo com observacoes duplicadas. Apos a execucao de duplas, cair. Verificamos que nao ha outras observacoes duplicadas. Parece que nos livramos das observacoes duplicadas. No Stata, varios programas estao disponiveis para detectar as duplicatas e tambem podem, opcionalmente, soltar as duplicatas. Um dos programas e chamado de dups. O programa dups nao e um programa incorporado no Stata, mas pode ser instalado atraves da internet usando o findit dups (consulte Como posso usar o comando findit para procurar programas e obter ajuda adicional para obter mais informacoes sobre o uso do findit). Uma vez que o dups esta instalado, podemos usa-lo imediatamente. Este exemplo usa o seguinte subconjunto do conjunto de dados maior usado acima com duplicatas adicionadas. Primeiro, nos inserimos os dados: entao nos os observamos: no nosso exemplo, temos um grupo de observacoes com duplicatas consistindo na observacao numero 1, 7 e 8. Isso e o que vemos abaixo. Agora usaremos o comando dups. Sem argumentos, dups retorna informacoes sobre o numero de grupos de observacoes que tem duplicatas e o numero de duplicatas em cada grupo. Podemos adicionar uma lista de variaveis ??apos dups. Por exemplo, no exemplo a seguir, adicionamos a variavel corrida apos a duplicacao. Agora, dups conta o numero de observacoes duplicadas apenas na corrida variavel. Podemos ver na lista do conjunto de dados que existem tres grupos de observacoes de raca (1, 2 e 4) e dois deles tem duplicatas. Isso e mostrado por dups abaixo. Ao adicionar a opcao unica. Tambem solicitamos informacoes sobre grupos que tenham uma unica observacao unica. Por exemplo, Com a tecla de opcao (varlist). Podemos solicitar a lista das observacoes. Por exemplo, no exemplo a seguir, vemos os valores de id em cada grupo. Uma opcao chamada terse pode ser adicionada para obter informacoes resumidas sobre duplicatas. Por exemplo, agora e se quisermos soltar as duplicatas, podemos fazer isso adicionando uma opcao chamada drop. Queremos avisa-lo de que e sempre perigoso excluir as observacoes, pois pode perder os dados. Portanto, faca sempre com cautela. O que e bom sobre dups e que ele cria uma nova variavel que contem informacoes suficientes para recuperar as observacoes excluidas se mudarmos a nossa opiniao sobre o que acabamos de fazer. O nome padrao da variavel e expandido (voce pode alterar o nome usando a opcao expandir apos dups). Usando a variavel expandir, podemos recuperar as observacoes excluidas usando um comando chamado expandir. Veja o exemplo abaixo. Se, por algum motivo, voce quisesse retornar a um conjunto de dados que tenha duplicatas, voce pode usar o comando expandir, usando a variavel de expansao criada por dups para especificar o numero de duplicatas a serem feitas. Observe que isso so ira recuperar seu conjunto de dados original se voce detectou duplicatas com base em todas as variaveis ??em seu conjunto de dados. Se voce usou apenas um subconjunto de variaveis, voce so podera recriar com precisao os valores desses casos (porque voce nao possui dados sobre as variaveis ??que nao foram usadas para determinar duplicatas). Agora, vimos como detectar e soltar observacoes duplicadas usando o comando dups escrito pelo usuario. O conteudo deste site nao deve ser interpretado como um endosso de qualquer site, livro ou produto de software especifico da Universidade da California.