Entrevista com Rick Wicklin, pesquisador do SAS®

sábado, 18 de maio de 20130 comentários


EXCLUSIVO

Entrevista com Rick Wicklin
Principal pesquisador em Estatística computacional
SAS Pesquisa e Desenvolvimento

Interview with Rick Wicklin
Principal researcher in computational statistics
SAS Research and Development


Rick Wicklin é o principal pesquisador em estatística computacional no SAS, onde desenvolve e fornece suporte sobre o procedimento IML e os aplicativos SAS/IML Estudio. Ele recebeu um PhD pela Universidade de Cornell e tem sido um usuário SAS desde 1997. Rick apresentou inúmeros tutoriais e artigos em conferências de Estatística e em grupos de usuários no SAS e é ativo na American Statistical Association. Rick mantém um blog para programadores estatísticos: blogs.sas.com/content/iml/

Rick Wicklin is a principal researcher in computational statistics at SAS, where he develops and supports the IML procedure and the SAS/IML Studio application. He received a PhD from Cornell University and has been a SAS user since 1997. Rick has presented numerous tutorials and papers at statistical and SAS users group conferences and is active in the American Statistical Association. Rick maintains a blog for statistical programmers at blogs.sas.com/content/iml/




estatísti.CO -  Como você mantém um blog atualizado com grande periodicidade?
How do you keep a blog updated with high frequency? 

Rick Wicklin: Eu acordo às 5:00h e trabalho na minha pesquisa e no meu blog até o café da manhã, às 6:30h. Isso me fornece cerca de 10 horas semanais para aprender e escrever.

I wake up at 5:00 in the morning and work on my research and my blog until breakfast at 6:30.  That gives me about 10 hours each week to learn and to write.




estatísti.CO -  O que você acha que os seus leitores procuram no seu blog?
What do you think your readers are looking for on your blog? 

Rick Wicklin: Meus leitores são programadores estatísticos que utilizam o software SAS. Eu escrevo sobre temas que me interessam, tais como cálculos matriciais, gráficos estatísticos, análise de dados e simulação. Às vezes eu escrevo sobre a probabilidade ou explico uma técnica estatística particularmente interessante. Eu tento transmitir o motivo desses temas serem relevantes para um estatístico que os praticará. Eu incluo um programa SAS em quase todos as postagens do blog. Muitas vezes incluo um programa na linguagem SAS / IML, que é a linguagem de programação de matrizes no SAS. No entanto, tenho muitos leitores que não são programadores SAS / IML, então eu também discuto o código do passo DATA , os procedimentos SAS / STAT, e os procedimentos gráficos.

My readers are statistical programmers who use SAS software.  I write about topics that interest me—such as matrix computations, statistical graphics, data analysis, and simulation.  Sometimes I write about probability or explain a particularly interesting statistical technique. I try to convey why these topics are relevant to a practicing statistician. I include a SAS program in almost every blog post. Often I include a program in the SAS/IML language, which is the SAS matrix programming language. However, I have many readers who are not SAS/IML programmers, so I also discuss  DATA step code, SAS/STAT procedures, and graphical procedures.




estatísti.CO -  Qual a importância dos softwares para a apresentação e análise de dados? Basta termos um bom software?
What is the importance of the software for presentation and data analysis? Is having good software enough? 

Rick Wicklin: Ter um bom software não é suficiente. As pessoas que utilizam excelente software ainda podem produzir uma análise pobre. Gráficos extravagantes e tabelas coloridas não significam que uma análise possui alta qualidade. Um bom analista obtem êxito independentemente do software. Olhe para as análises feitas por Mosteller, Tukey e Hoaglin dos anos 1960 e 70. Esses estatísticos não possuíam excelentes softwares, mas criaram grandes análises. No entanto, eu acho que o software estatístico de alta qualidade pode ajudar um analista da mesma forma que boas ferramentas podem ajudar um bom carpinteiro. Com as ferramentas certas, ambos podem trabalhar de forma rápida sem sacrificar a qualidade ou segurança.

Having good software is not enough.  People who use great software can still produce a poor analysis.  Fancy graphs and colorful tables do not imply that an analysis has high quality. A good analyst succeeds regardless of the software.  Look at the analyses by Mosteller, Tukey, and Hoaglin from the 1960s and ‘70s. Those statisticians did not have great software, but they created great analyses. However, I do think that high-quality statistical software can assist an analyst in the same way that good power tools aid a carpenter. With the right tools, both can work quickly without sacrificing quality or safety.



Blog do Rick Wicklin: dicas para programadores estatísticos.




estatísti.CO -  Como a crescente quantidade de dados nos desafia a aproveitar as informações que podemos obter através dos dados?
How are the increasing volumes of data challenging us to take advantage of the information we can obtain from the data? 

Rick Wicklin: Todos estão falando sobre Big Data, mas eu acho que os princípios fundamentais da análise de dados são relevantes, independentemente do tamanho de dados. Com o grande volume de dados você tem que ser computacionalmente eficiente, mas o software SAS sempre se destacou em eficiência. Mais dados nem sempre significam dados melhores. No entanto, para pessoas que têm de analisar grandes quantidades de dados, SAS desenvolveu técnicas computacionais que escalam com o número de processadores disponíveis.

Everyone is talking about Big Data, but I think that the fundamental principles of data analysis are relevant regardless of the data size.  With big data you have to be computationally efficient, but SAS software has always excelled at efficiency. More data is not always better data. However, for people who have to analyze massive amounts of data, SAS has developed computational techniques that scale with the number of available processors.




estatísti.CO -  Quais dicas você daria a um estatístico que não sabe qual software escolher para trabalhar? O que levar em consideração para essa escolha? 
What advice would you give to a statistician who does not know which software to choose to work? What shall (s)he take into account for this choice? 

Rick Wicklin: A minha sugestão é que você escolha o software que o faz produtivo e permita que colaboradores com seus colegas de trabalho. Além disso, lembre-se que a análise estatística é uma pequena parte de uma análise de dados completa. A aquisição de dados, transformação de dados, limpeza de dados, e escrever um relatório pode demorar mais do que a análise estatística real. Se o seu software pode ajudar com essas tarefas, este sim é um benefício importante.

I would suggest that you choose software that makes you productive and enables you to collaborate with your coworkers. Also, remember that statistical analysis is a tiny part of a complete data analysis. Acquiring data, transforming data, cleansing data, and writing a report can take longer than the actual statistical analysis. If your software can help with those tasks, that is an important benefit.




estatísti.CO -  Quais são as suas expectativas para o lançamento do seu novo livro? O que poderemos encontrar nele?
What are your expectations about the release of your new book? And what can we expect from it? 

Rick Wicklin: Meu novo livro, Simulating Data with SAS, discute em detalhes como simular a partir de distribuições univariadas e multivariadas comuns e como usar simulação para avaliar técnicas estatísticas. Ele foi adotado por vários professores para os cursos que usam simulação estatística. Eu o escrevi pois algumas pessoas me disseram que eles usam SAS para toda a sua análise de dados, mas, em seguida, mudam para outra linguagem para a simulação. Isso é loucura. Quando você usa SAS de forma eficiente, as simulações rodam incrivelmente rápido.

My new book, Simulating Data with SAS, discusses in detail how to simulate from common univariate and multivariate distributions and how to use simulation to evaluate statistical techniques.  It has been adopted by several professors for courses that use statistical simulation.  I wrote it because some people said to me that they use SAS for all of their data analysis, but then switch to another language for simulation.  That’s crazy. When you use SAS efficiently, simulations run blazingly fast.



Livros de autoria de Rick




estatísti.CO -  Você possui formação em Matemática, entretanto desenvolve trabalhos em um software na área da Estatística. Como isso aconteceu? Como aprendeu Estatística?
You have education in Mathematics, however currently work on software in the field of Statistics. How did this happen? How did you learn Statistics? 

Rick Wicklin: Eu aprendi Estatística no trabalho, e eu ainda estou aprendendo! Minha graduação foi em Matemática Aplicada, onde aprendi muitos algoritmos matemáticos. A maioria das técnicas estatísticas são baseadas em procedimentos matemáticos que têm estado ao nosso redor por anos. Otimização era conhecida por Newton. Cálculos matriciais e análise de séries temporais eram conhecidos por Gauss. Para um matemático, a regressão por mínimos quadrados não é nada mais do que a álgebra linear e a análise de componentes principais é apenas a geometria de autovalores e autovetores. A Matemática me auxilia a compreender as ideias principais; eu trabalho os detalhes depois.

I learned statistics on the job, and I am still learning! My graduate education was in applied mathematics, where I learned many mathematical algorithms. Most statistical techniques are based on mathematical procedures that have been around for years. Optimization was known to Newton. Matrix computations and time series analysis were known to Gauss. To a mathematician, least squares regression is nothing more than linear algebra, and principal component analysis is merely the geometry of eigenvalues and eigenvectors. Math helps me to understand the main ideas; I work out the details later.




estatísti.CO -  Como é trabalhar no SAS, uma empresa considerada e eleita uma das melhores do mundo para se trabalhar?
What is it like working at SAS, a company considered and voted one of the best in the world to work for?

Rick Wicklin: Eu amo trabalhar no SAS. O SAS recebe um monte de publicidade pelos seus benefícios, mas eu fico no SAS por causa de excelentes colegas de trabalho e de uma grande empresa com foco no compromisso com a qualidade

I love working at SAS. SAS gets a lot of publicity for its benefits, but I stay at SAS because of excellent coworkers and a company-wide commitment to quality.  




"Não tente fazer algo complicado até você entender o simples."




estatísti.CO -  Qual é, na sua opinião, o maior benefício que o SAS IML trouxe para o profissional que utiliza este software?
What, in your opinion, is the biggest benefit that the SAS IML can bring to professionals who use this software? 

Rick Wicklin: O software SAS contém centenas de análises convencionais. Mas às vezes você precisa de uma análise que não é construída em algum procedimento SAS. O maior benefício da linguagem SAS / IML é que você pode utilizá-la para estender as capacidades do software SAS.

SAS software contains hundreds of standard analyses. But sometimes you need an analysis that is not built into any SAS procedure. The biggest benefit of the SAS/IML language is that you can use it to extend the capabilities of SAS software.




estatísti.CO -  O que é preciso para ser um bom programador? O que fazer para se aprimorar?
What does it take to be a good programmer? What do you do to improve yourself? 

Rick Wicklin: Programar é a melhor maneira de aprender programação, então eu programo todos os dias. Eu acho que um bom programador sempre tenta ser eficiente, então eu revejo constantemente a eficiência dos meus programas. Acredito que se deve aprender algo novo todos os dias, sendo assim tento passar algumas horas por semana lendo outra programação e blogs estatísticos.

Programming is the best way to learn programming, so I program every day. I think that a good programmer always tries to be efficient, so I constantly review the efficiency of my programs. I also believe in learning something new every day, so I try to spend a few hours each week reading other programming and statistical blogs.




estatísti.CO -  Deseja deixar alguma mensagem para os jovens brasileiros que sonham em ser profissionais de sucesso?
Do you want to leave any messages to young Brazilians who dream of achieving professional success? 

Rick Wicklin: Simples é melhor. Use algoritmos simples. Escreva programas simples. Explique-se em termos simples. Não tente fazer algo complicado até você entender o simples.

Simple is better. Use simple algorithms. Write simple programs. Explain yourself in simple terms.  Do not attempt something complicated until you understand the simple.


Tradução: João Victor Dias


Compartilhe :
 
Support : Creating Website | Johny Template | Mas Template
Copyright © 2011. Estatisti.co - All Rights Reserved
Template Created by Creating Website Published by Mas Template
Proudly powered by Blogger