domingo, fevereiro 11, 2007
O trabalho TPC 3 e TPC 4 podem ser entregues ate dia 20, terca-feira de Carnaval.
quarta-feira, janeiro 24, 2007
Ficheiros do LNEC
Aqui está o endereço dos ficheiros sobre sismos que são do LNEC e que podem ser utilizados para o TPC3.
http://www.iilab.com/sima/Portugal_catalogo_sismico_ate_1999_enviado_Nuno_charneca_2006_nov.xls
http://www.iilab.com/sima/mapa_epicentros.zip
Tenham atenção que os dados são do LNEC.
http://www.iilab.com/sima/Portugal_catalogo_sismico_ate_1999_enviado_Nuno_charneca_2006_nov.xls
http://www.iilab.com/sima/mapa_epicentros.zip
Tenham atenção que os dados são do LNEC.
segunda-feira, janeiro 15, 2007
quarta-feira, janeiro 10, 2007
TPC 2 quarta parte
Mais uma nota do Manuel Costa a pensar em vós:
Já agora envia também o link antigo do snirh que é melhor para descarregar dados.
http://snirh.inag.pt/snirh/dados_base/sub_nav.php
Já agora envia também o link antigo do snirh que é melhor para descarregar dados.
http://snirh.inag.pt/snirh/dados_base/sub_nav.php
TPC 2 terceira parte
Algumas notas relativamente ao trabalho:
Pré-processamento dos dados
Após retirarem os dados do snirh (alturas de água e precipitações), podem utilizar pivot tables para agregarem dados.
Análise
Após tratarem os dados que vão ser utilizados para construírem a vossa árvore de classificação, devem decompor a tabela resultante em 3 subconjuntos de dados utilizando XlMiner->Partition Data-> Standard Partition:
1 – Para construir a árvore de classificação (Training Set);
2- Dados para reduzir o efeito de sobre-ajustamento (Validation Set);
3- Dados para testar se a árvore final está correcta (Test Set).
Após a partição dos dados, utilizem a worksheet produzida como input de dados da árvore de classificação.
Devem utilizar as 3 “classification confusion matrix” para avaliarem a qualidade dos resultados. Esta matriz diz-nos a quantidade de classes que foram correctamente previstas. A gama de erros deve ser sempre a mesma independentemente da percentagem de erro na previsão.
Para chegarem a um resultado tenham em atenção que os 3 conjuntos de dados podem ser retirados aleatoriamente, podendo haver diferentes resultados para diferentes pacotes de partição.
Pré-processamento dos dados
Após retirarem os dados do snirh (alturas de água e precipitações), podem utilizar pivot tables para agregarem dados.
Análise
Após tratarem os dados que vão ser utilizados para construírem a vossa árvore de classificação, devem decompor a tabela resultante em 3 subconjuntos de dados utilizando XlMiner->Partition Data-> Standard Partition:
1 – Para construir a árvore de classificação (Training Set);
2- Dados para reduzir o efeito de sobre-ajustamento (Validation Set);
3- Dados para testar se a árvore final está correcta (Test Set).
Após a partição dos dados, utilizem a worksheet produzida como input de dados da árvore de classificação.
Devem utilizar as 3 “classification confusion matrix” para avaliarem a qualidade dos resultados. Esta matriz diz-nos a quantidade de classes que foram correctamente previstas. A gama de erros deve ser sempre a mesma independentemente da percentagem de erro na previsão.
Para chegarem a um resultado tenham em atenção que os 3 conjuntos de dados podem ser retirados aleatoriamente, podendo haver diferentes resultados para diferentes pacotes de partição.
Nao e sobre o TPC2
So apenas 3 minutos para verem o que leva ao sucesso, alias que aproveito para vos desejar.....
http://www.ted.com/tedtalks/tedtalksplayer.cfm?key=r_stjohn
segundo Richard St John tem a ver com paixão e persistencia. Distraiam-se :-)
http://www.ted.com/tedtalks/tedtalksplayer.cfm?key=r_stjohn
segundo Richard St John tem a ver com paixão e persistencia. Distraiam-se :-)
Nao e sobre o TPC2
So apenas 3 minutos para verem o que leva ao sucesso, alias que aproveito para vos desejar.....
http://www.ted.com/tedtalks/tedtalksplayer.cfm?key=r_stjohn
segundo Richard St John tem a ver com paixão e persistencia. Distraiam-se :-)
http://www.ted.com/tedtalks/tedtalksplayer.cfm?key=r_stjohn
segundo Richard St John tem a ver com paixão e persistencia. Distraiam-se :-)
sexta-feira, dezembro 29, 2006
quinta-feira, dezembro 28, 2006
TPC 2
Problema
A generalização das redes de monitorização de variáveis ambientais e de variáveis meteorológicas, associado a um nº cada vez maior de métodos de Data Mining, tem vindo a fomentar a utilização de técnicas conhecidas por “Data Driven Modeling”.
O ano de 2006 foi especialmente afectado por cheias por todo o país, sendo por isso fundamental a correcta produção de alertas às populações para minimizar os efeitos inerentes.
Objectivo
Assim, com este trabalho pretende-se que o aluno seja capaz de desenvolver uma ferramenta analítica capaz de prever possíveis riscos de cheias a 3 dias de distância para a estação hidrométrica do Agroal na Bacia do Rio Tejo. Para tal, o aluno deverá utilizar o algoritmo de classificação (CART) disponível no Add-in de Excel XLMiner.
O que deve ser entregue
• Relatório com um pequeno enquadramento do problema, os procedimentos adoptados e os resultados obtidos. Este deverá ter um máximo de 5 páginas (excluindo a capa) e letra de tamanho mínimo de 10.
• Ficheiro de Excel com a possibilidade de ser alimentado por novos dados e serem encontradas novas árvores de classificação
O que vai ser avaliado
Para além do relatório, vai ser igualmente avaliada a versatilidade do ficheiro de Excel a novos dados e respectivo processo analítico
Conselhos
• Utilizem agregações diárias de alturas de água como média, mediana ou outro percentil para inferir o risco de cheia. Algo do tipo, se o valor for superior a x, então a minha categoria dependente é 1, senão é 0.
• Utilizem dados de uma estação meteorológica nas imediações da estação hidrométrica do Agroal como variáveis independentes. Convém não esquecer que alturas de água em tempos anteriores aos do de previsão poderão igualmente ser importantes para uma correcta previsão.
• Podem utilizar macros de Visual Basic para simplificar o processo de treino da Árvore de Classificação, mas, por favor, não compliquem! Utilizem a programação apenas para o necessário.
A generalização das redes de monitorização de variáveis ambientais e de variáveis meteorológicas, associado a um nº cada vez maior de métodos de Data Mining, tem vindo a fomentar a utilização de técnicas conhecidas por “Data Driven Modeling”.
O ano de 2006 foi especialmente afectado por cheias por todo o país, sendo por isso fundamental a correcta produção de alertas às populações para minimizar os efeitos inerentes.
Objectivo
Assim, com este trabalho pretende-se que o aluno seja capaz de desenvolver uma ferramenta analítica capaz de prever possíveis riscos de cheias a 3 dias de distância para a estação hidrométrica do Agroal na Bacia do Rio Tejo. Para tal, o aluno deverá utilizar o algoritmo de classificação (CART) disponível no Add-in de Excel XLMiner.
O que deve ser entregue
• Relatório com um pequeno enquadramento do problema, os procedimentos adoptados e os resultados obtidos. Este deverá ter um máximo de 5 páginas (excluindo a capa) e letra de tamanho mínimo de 10.
• Ficheiro de Excel com a possibilidade de ser alimentado por novos dados e serem encontradas novas árvores de classificação
O que vai ser avaliado
Para além do relatório, vai ser igualmente avaliada a versatilidade do ficheiro de Excel a novos dados e respectivo processo analítico
Conselhos
• Utilizem agregações diárias de alturas de água como média, mediana ou outro percentil para inferir o risco de cheia. Algo do tipo, se o valor for superior a x, então a minha categoria dependente é 1, senão é 0.
• Utilizem dados de uma estação meteorológica nas imediações da estação hidrométrica do Agroal como variáveis independentes. Convém não esquecer que alturas de água em tempos anteriores aos do de previsão poderão igualmente ser importantes para uma correcta previsão.
• Podem utilizar macros de Visual Basic para simplificar o processo de treino da Árvore de Classificação, mas, por favor, não compliquem! Utilizem a programação apenas para o necessário.
Envio de TPC
O TPC 1 deve ser enviado para o Nuno Capeta por email.
Para aumentar a redundancia do sistema enviem por favor com cc para mim.
Para aumentar a redundancia do sistema enviem por favor com cc para mim.
TPC 4
Elaboração de um portfolio na web.
Esse portfolio deve incluir os trabalhos de SIMA.
O trabalho é individual.
Esse portfolio deve incluir os trabalhos de SIMA.
O trabalho é individual.
segunda-feira, dezembro 18, 2006
FTP
havia um problema no username.
o endereço é: ftp:\\www.ydreams.com
username: sima@ydreams.com
o password é o mesmo anterior.
o endereço é: ftp:\\www.ydreams.com
username: sima@ydreams.com
o password é o mesmo anterior.
TPC 3
Visualizacao Interactiva
1 - Utilize ferramentas de visualização, tais como o Google Earth ou o Virtools, para representar e melhor compreender um fenómeno ambiental.
Os dados e a técnica de representação são à vossa escolha., mas tenho disponível dois conjuntos de dados do LNEC sobre meteorologia e sismos que podem ser utilizados para este fim.
2 - Imagine uma interface baseda na ideia de reality computing para interagir com os dados utilizados em 1. Descreva essa interface de modo apelativo.
Este trabalho é entregue a cgouveia@netcabo
1 - Utilize ferramentas de visualização, tais como o Google Earth ou o Virtools, para representar e melhor compreender um fenómeno ambiental.
Os dados e a técnica de representação são à vossa escolha., mas tenho disponível dois conjuntos de dados do LNEC sobre meteorologia e sismos que podem ser utilizados para este fim.
2 - Imagine uma interface baseda na ideia de reality computing para interagir com os dados utilizados em 1. Descreva essa interface de modo apelativo.
Este trabalho é entregue a cgouveia@netcabo
Contactos
aqui fica a lista de contactos para os TPC todos @Ydreams.com
Nuno Capeta (Web sites e bases de Dados) - nuno.capeta
Tiago Bilou (Web sites e bases de Dados e Google Earth) - tiago.bilou
Joao Lopes (Sketchup, Google Earth) - joao.lopes
Manuel Costa (programação e data mining) - manuel.costa
João Serpa (Interfaces tangiveis e afins e programação) - joao.serpa
Tiago Carita (modelos 3D) - tiago.carita
Sérgio Estevão (Virtools e animaçoes) - sergio.estevao
qualquer duvida ou angustia gerais
António Câmara
Cristina Gouveia - cgouveia@netcabo
Nuno Capeta (Web sites e bases de Dados) - nuno.capeta
Tiago Bilou (Web sites e bases de Dados e Google Earth) - tiago.bilou
Joao Lopes (Sketchup, Google Earth) - joao.lopes
Manuel Costa (programação e data mining) - manuel.costa
João Serpa (Interfaces tangiveis e afins e programação) - joao.serpa
Tiago Carita (modelos 3D) - tiago.carita
Sérgio Estevão (Virtools e animaçoes) - sergio.estevao
qualquer duvida ou angustia gerais
António Câmara
Cristina Gouveia - cgouveia@netcabo