PMML(Predictive Model Markup Language)는 XML 기초의 마크업 언어이다. 예측 분석(Predictive Analytics)과 Data Mining 에 관한 모델을 정의하거 PMML 호환 응용프로그램 사이에 모델을 공유하기 위해 DMG(Data Mining Group)에서 만들었다.
PMML은 독점 문제와 비호환성 모델과 응용프로그램간의 교환 장벽이 없는 모델을 정의하여 솔루션사 독립적인 방법의 응용프로그램을 제공한다. 그래서 모델은 하나의 벤더의 프로그램에서 개발을 하고 다른 벤더의 응용프로그램에서 시각화, 분석, 평가를 할 수 있다.
PMML Components
- Header : Version and time stamp, Model development environment information
- Data Dictionary : Definition of : variable types, valid, invalid, and missing values
- Data Transformations : Normalization, mapping and discretization, Data aggregation and fuction calls
- Model : Description and model specific attributes
- Mining Schema : Definition of: usage type, outlier and missing value treatment and replacement
- Targets : Score post-processing-scaling
PMML 제품
- IBM InfoSphere Warehous, SPSS Modeler, SPSS Statistics
- Microsoft SQL Server 2008 Analysis Services
- Rattle/R
- SAS Enterprise Miner
PMML 4.0
2009년 6월 16일에 릴리즈함.
- Improved Pre-Processing Capabilites
- Time Series Models
- Model Explanation
- Multiple Models
- Extensions of Existing Elements
(출처:wikipedia)
이 글은 스프링노트에서 작성되었습니다.
'소프트웨어 공학' 카테고리의 다른 글
R (0) | 2011.12.06 |
---|---|
Multi-tenancy (0) | 2011.12.06 |
XP (eXtreme Programming) (0) | 2011.04.19 |
IT Governance (0) | 2011.02.09 |
EPMO (0) | 2010.11.16 |