GitHub, GitLab, 또는 Bitbucket을 백업해야 하는 이유—데이터 손실의 위험

당신의 조직이 GitHub, GitLab, Bitbucket과 같은 버전 제어 시스템을 사용한다면, 코드를 지식 재산으로서 회사 내에서 가장 귀중한 자산이라는 것을 아마도 잘 알고 있을 것입니다. 당신과 당신의 팀은 수천 시간(그리고 돈)을 투자하여 프로젝트를 작성, 지원 및 개선하였습니다. CTO, IT 관리자, 소프트웨어 하우스 소유자 또는 팀 리더로서, 팀이 몇 달간 작업한 코드를 잃는 것이 얼마나 큰 비용인지 상상하실 수 있을 것입니다.

하지만 이것이 가능할까요? 데이터 유출, 시스템 다운타임, 정책 변경 등, 이러한 모든 요소들이 GitHub, GitLab, Bitbucket의 저장소에 대한 접근을 제한하고 지식 재산에 위험을 초래할 수 있습니다. IP를 적절하게 보호하지 않으면 직원들이 만든 코드의 완전한 잠재력을 활용하지 못할 수도 있습니다.

Git 데이터에서 무엇이 잘못될 수 있나요?

이제, 당신의 개발 프로세스와 회사 보안에 대한 전문적인 저장소 백업 소프트웨어가 필수적이라는 논거를 들어 상사, 팀원, 심지어 개발자들과의 토론에서 당신을 뒷받침할 수 있는 주장들을 찾아보겠습니다.

1. 공유 책임 모델

대부분의 SaaS 제공업체와 마찬가지로 GitHub, GitLab, Atlassian은 보안 역할 중 서비스 제공업체가 처리하는 부분과 조직이 담당하는 부분을 정의하는 공유 책임 모델에 의존합니다. 간단히 말해, 서비스 제공업체는 전체 시스템의 접근성, 보안, 가용성에 대한 책임이 있습니다. 그러나 데이터와 관련하여 그들은 단지 데이터 처리자에 불과합니다. 당신은 소유자이므로 당신의 데이터는 당신의 문제입니다. 모든 법적 요구 사항을 준수하는 것, 예를 들어 데이터 보존 조건을 적절하게 보호해야 합니다.

Atlassian에서는 회사가 애플리케이션 자체, 그 애플리케이션이 실행되는 시스템, 그리고 해당 시스템이 호스팅되는 환경의 보안을 책임지고 있습니다. 그들은 SOC2나 PCI DSS와 같은 표준을 준수하는 것을 보장합니다.

당신은 계정의 정보를 적절하게 관리할 책임이 있습니다. 사용자, 데이터 액세스, 설치하고 신뢰하는 앱을 제어해야 합니다. 마지막으로 회사가 준수 요건을 충족하고 있는지 확인할 책임이 있습니다. 아래 이미지와 같이:

Image: Atlassian Cloud Security Shared Responsibilities (Source: Atlasssian)

2. 서비스 중단

우리의 말을 믿거나 직접 확인해 보세요. 그러나 GitHub, Bitbucket 또는 GitLab이 다운되어 많은 회사가 코드에 접근할 수 없고 작업할 수 없는 상황이 여러 차례 발생했습니다. 더 나아가 많은 금전적 손실을 입게 되었습니다.

TechCrunch에 따르면 2017년 GitLab의 가장 큰 중단 사태 중 하나가 발생했습니다. 이는 기본 데이터베이스 서버에서 데이터가 실수로 삭제되어 발생했습니다. 이 사고로 GitLab.com이 수 시간 동안 사용할 수 없게 되었으며, 복구할 수 없는 일부 생산 데이터를 잃었습니다. 특히, 데이터베이스와 데이터에 대한 수정, 프로젝트, 댓글, 사용자 계정, 문제 및 스니펫 등이 손실되었습니다.

TechMonitor에 따르면 2020년 6월에는 수 시간 동안 지속되며 수백만 명의 개발자에게 영향을 미친 GitHub 서비스의 주요 중단이 발생했습니다.

그런 종류의 중단은 개발자의 생산성에 영향을 미칠 수 있으며, 특히 중요한 출시 기간 동안 발생할 경우 더욱 그러합니다.

당신의 회사를 생각해보세요:

  • GitHub 데이터에 접근할 수 없게 되면 얼마나 오랫동안 작업할 수 있습니까?
  • 그런 중단이 회사에 얼마나 많은 비용을 초래할까요?
  • 그것을 감당할 수 있습니까?

It’s better to prevent such situations and invest in reliable third-party backup software to quickly recover data and get back to code and work. GitHub downtime is only the tip of the iceberg. 

3. 인적 오류

인터넷 보안 사고의 가장 흔한 원인 중 하나는 일반적으로 인간의 실수나 오류, 헤드 오버라이트, 분기의 실수로 인한 삭제, 심지어 짜증난 직원이나 아직 저장소에 접근할 수 있는 이전 직원에 의한 의도적인 삭제 등입니다. 이러한 것들은 데이터 손실의 가장 흔한 원인입니다. 또한 개발자들이 개인적이든 직업적이든 하나의 GitHub 계정을 사용하는 경우가 많으며, 때로는 저장소를 혼용하기도 합니다. 따라서 이를 주시하는 것이 매우 중요합니다. 

4. 랜섬웨어

랜섬웨어는 역사상 기업에게 가장 비싼 위협 중 하나로 남아있습니다. 11초마다 발생하며, 2021년 말까지 200억 달러의 전 세계적인 손실을 초래할 것으로 예상됩니다(2015년 대비 3억 2500만 달러). 

2019년, Bleeping Computer에 따르면 공격자들은 GitHub, GitLab, Bitbucket 사용자들을 대상으로 코드와 커밋을 여러 저장소에서 삭제하고 랜섬웨어 메시지와 많은 의문만 남겼습니다.

랜섬웨어 공격으로 인한 업무 중단 기간은 보통 며칠 정도 지속됩니다. 이후 모든 시스템을 복구하는 데에는 몇 주가 소요되며, 신뢰할 수 있는 백업 소프트웨어가 없다면 이러한 시도는 보통 실패합니다. 랜섬을 지불하는 것이 데이터 복구에 대한 100% 보장을 제공한다고 믿을 수 없습니다. 버전 관리 시스템에 대해 말하자면, 암호화된 상태로 남아있는 데이터에 접근할 수 없는 경우에도 중단이 발생할 수 있습니다. Git 백업이 있고 언제든지, 어느 시점에서든 데이터를 복구하고 바로 작업에 재개할 수 있는 경우에만 그렇게 됩니다. 그리고 가장 중요한 것은, 데이터를 완전히 잃지 않는 것입니다.

5. 하드웨어 및 소프트웨어 오류

데이터에 접근할 수 없게 되는 것은 인간의 실수나 해커 공격뿐만 아니라 다양한 종류의 하드웨어 및 소프트웨어 오류에 의해서도 영향을 받을 수 있습니다. 개발자들이 로컬 git 저장소에서 작업하는 경우 특히 위험합니다.

동기화, 저장소 저장 및 다운로드 관련 문제를 추가하면, 개발 프로세스를 느리게, 연기하거나 비활성화하고 회사에 재정적 손실을 유발할 수 있는 문제의 전체 범위를 볼 수 있습니다.

6. 보안 규정 준수

단 몇 마디만 합시다: SOC2와 ISO 27001. 왜 이러한 표준이 그렇게 바람직한가요? 그 이유는 회사가 SOC2 또는 ISO 27K 감사를 완료하면 보안, 신뢰성, 신뢰할 수 있는 서비스로 자리잡을 수 있기 때문입니다. 이러한 보안 표준이 회사를 경쟁사들 사이에서 눈에 띄게 만드나요? 분명히 그렇습니다!

검증을 통과하고 안전한 서비스 상태를 획득하기 위한 요건 중 하나는 백업입니다. 이는 언제든지 데이터를 복구할 수 있는 보장이며 회사의 비즈니스 연속성에 대한 위협이 없음을 의미합니다.

결론

보시다시피, GitHub, Bitbucket, GitLab과 같은 호스팅 서비스들은 상당히 신뢰할 수 있는 솔루션으로 입증되었지만, 완벽한 방어가 되지는 못합니다. 그래서 GitHub는 예를 들어, 추가적인 타사 백업 소프트웨어를 갖추는 것을 권장합니다.

참고: 여기서 노름은 당신의 소스 코드, 프로젝트, 지적 재산(IP), 수십 시간의 작업, 수천 달러의 가치입니다. 따라서 전문적인 백업 소프트웨어는 그것이 제공하는 안도감에 비해 작은 투자처럼 보입니다.

Source:
https://dzone.com/articles/why-you-should-backup-github-gitlab-or-bitbucket