Java와 C의 zip 압축 연산에 대한 퍼포먼스 비교

먼저 C의 zip 압축은 Jean-loup Gailly님이 만들어 공개한 zlib 1.2.2를 사용했습니다. C/C++에서 데이터의 압축에서 사용하는 압축 라이브러리는 흔히 이 zlib를 사용합니다.  그리고 Java에서 압축은 기본적으로 제공하는 java.util.zip.Deflater 클래스를 사용했습니다. 테스트를 한 이유는 Java가 C/C++에 비해서 얼마나 느릴까… 하는 기대였습니다. =_=;

Java와 C/C++ 모두 사용한 압축 데이터는 0.2메가 정도되는 jpg 파일로 했습니다. 그리고 Java와 C/C++ 모두 결과는 압축 레벨을 3으로 했을때 동일한 결과와 크기였으며 원본 크기에 비해 75% 정도의 압축되었습니다. 결과는 다음 같습니다. 첫번째 이미지는 Java의 결과이고.. 두번째는 C/C++의 결과입니다.

사용자 삽입 이미지
와우!! Java가 C/C++에 비해 상당히 느릴것으로 기대했는데… 그렇지 않았습니다. C/C++와 성능은 거의 비슷한 것으로 생각됩니다. 두 경우 모두 최악의 경우 0.016초정도 소요됩니다. 다만…. Java의 경우 가끔씩 튀는 부분이 있었는데.. 0.031초 정도 소요되는 부분이 가끔 나옵니다. 아마도 Java의 gc기능 때문이 아닌가… 가볍게 짐작해봅니다. 하지만 이런 부분은 제외하면 정말 C/C++과 같은 Native 컴파일러 못지 않은 성능이라고 판단됩니다.

아래는 Java에서 퍼포먼스 테스트로 사용했던 코드입니다.

import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.util.zip.DataFormatException;
import java.util.zip.Deflater;
import java.util.zip.Inflater;
import java.io.*;

public class TestMain {
    public static void main(String[] args) 
        throws IOException, DataFormatException
    {
        FileInputStream fis = new FileInputStream("d:/a.jpg");
        ByteArrayOutputStream baos = new ByteArrayOutputStream(fis.available());
        byte [] buffer = new byte[512];
        int cntRead;
        while((cntRead=fis.read(buffer)) != -1) {
            baos.write(buffer, 0, cntRead);
        }

        byte[] compressedBytes = null;
        for(int i=0; i<20; i++) { // 20 times repeat..
            System.out.println("Performance Test Start...");
            long stime = System.currentTimeMillis();
 
            compressedBytes = Compress(baos.toByteArray());
   
            long etime = System.currentTimeMillis();
            System.out.println("Performance Test Result : " 
                + (etime-stime)+" MS.");
        }   
 
         FileOutputStream fos = new FileOutputStream("d:/a_java.jpg.zip");
         ByteArrayInputStream bais = new ByteArrayInputStream(compressedBytes);
         while((cntRead=bais.read(buffer)) != -1) {
             fos.write(buffer, 0, cntRead);
         }
    }

    private static byte[] Compress(byte[] bytesToCompress) throws IOException
    {
        Deflater compressor = new Deflater(3);
        compressor.setInput(bytesToCompress);
        compressor.finish();
 
        ByteArrayOutputStream bos = 
            new ByteArrayOutputStream(bytesToCompress.length);
 
        byte[] buf = new byte[bytesToCompress.length + 100];
        while (!compressor.finished())
        {
            bos.write(buf, 0, compressor.deflate(buf));
        }

        bos.close();
 
        return bos.toByteArray();
    }
}

대략 살펴보시면 위의 코드에는 IO에 대한 Buffer 기능과 같은.. 여전히 최적화의 여지가 남아 있습니다. 더 이상 제가 갖고 있는 “자바는 느리다”라는 선입견이 상당 부분 깨진 느낌입니다.

[GIS] ArcObjects, 도형의 좌표 구하기

ArcObjects를 통해 SHP 파일을 읽어서 만든 레이어를 화면상에 표시한 후… 이 레이어를 구성하는 도형(Shape) 좌표를 구하는 방법을 정리해 보았습니다. ArcObjects에서 제공하는 Map 컨트롤을 통해 SHP 레이어가 하나 추가되었다고 가정하겠습니다. 참고로 이 포스트는 레이어가 폴리곤 도형으로 구성된 레이어를 대상으로 합니다.

가장 먼저 해야할 일은 지도 컨트롤이 가지고 있는 레이어를 가져오는 일입니다. 가져올때 도형 정보에 접근해야 하므로 IFeatureLayer 인터페이스 타입으로 가져와야 합니다.

ESRI.ArcGIS.Carto.IFeatureLayer pFL;
pFL = axMapControl1.get_Layer(0) as ESRI.ArcGIS.Carto.IFeatureLayer;

이렇게 가져온 IFeatureLayer 변수인 pFL을 통해 각각의 Feature를 얻어오기 위해 IFeatureClass와 IFeatureCursor를 이용합니다.

ESRI.ArcGIS.Geodatabase.IFeatureClass pFClass;
pFClass = pFL.FeatureClass;

ESRI.ArcGIS.Geodatabase.IFeatureCursor pFCursor;
pFCursor = pFClass.Search(null, false);

이제 레이어를 구성하는 Feature를 읽을 수 있는 준비가 되었습니다. 아래의 반복문을 통해 각각의 Feature를 순회하면서 원하는 좌표를 읽게 됩니다.

ESRI.ArcGIS.Geodatabase.IFeature pFeature;            
while((pFeature=pFCursor.NextFeature()) != null) {
    ....
}

아래의 코드가 위의 코드의 반복문 사이(while문)에 들어가는 코드입니다. 도형은 Point의 집합이므로 IPointCollection 인터페이스 타입이 필요하며 각 포인트 좌표값과 관련 정보를 얻기 위해 IEnumVertex 인터페이스가 필요합니다.

    ESRI.ArcGIS.Geometry.IPointCollection pPC;
    pPC = pFeature.Shape as ESRI.ArcGIS.Geometry.IPointCollection;

    ESRI.ArcGIS.Geometry.IEnumVertex pEV = pPC.EnumVertices;

    ESRI.ArcGIS.Geometry.IPoint pPt;
    int outPartIndex;
    int vertexIndex;
    listBox1.Items.Add("FID: " + pFeature.OID);
    for(int i=0; i<pPC.PointCount; ++i) {
        pEV.Next(out pPt, out outPartIndex, out vertexIndex);
        listBox1.Items.Add("    Part Idx :" + outPartIndex + 
            " Vertex Idx : " + vertexIndex + " (" + pPt.X + "," + pPt.Y + ")");
    }

비록 이 포스트의 글은 폴리곤 레이어에 대한 내용이지만 이 보다 간단한 포인트나 폴리라인에 대해서도 쉽게 좌표를 읽을 수 있습니다. 마지막으로 아래는 위의 코드들을 실행했을때의 결과 입니다.

사용자 삽입 이미지