[BUG]: sagemaker_orchestration example gives Docker error: EOF #1580

Closed mushfiqulIslam closed 1 year ago

mushfiqulIslam commented 1 year ago

System Information

ZENML_LOCAL_VERSION: 0.40.1 ZENML_SERVER_VERSION: 0.40.1 ZENML_SERVER_DATABASE: sqlite ZENML_SERVER_DEPLOYMENT_TYPE: other ZENML_CONFIG_DIR: /root/.config/zenml ZENML_LOCAL_STORE_DIR: /root/.config/zenml/local_stores ZENML_SERVER_URL: ZENML_ACTIVE_REPOSITORY_ROOT: /home/mushfiq/zenml_examples/sagemaker_orchestration PYTHON_VERSION: 3.10.6 ENVIRONMENT: native SYSTEM_INFO: {'os': 'linux', 'linux_distro': 'ubuntu', 'linux_distro_like': 'debian', 'linux_distro_version': '22.04'} ACTIVE_WORKSPACE: default ACTIVE_STACK: test_sagemaker_stack ACTIVE_USER: mushfiq TELEMETRY_STATUS: enabled

What happened?

I ran sagemaker_orchestration according to provided guideline: https://github.com/zenml-io/zenml/tree/0.40.1/examples/sagemaker_orchestration. While pushing docker image to sagemaker EOF docker error raised.

Reproduction steps

Steps given here: https://github.com/zenml-io/zenml/tree/0.40.1/examples/sagemaker_orchestration

Relevant log output

Reusing registered pipeline fashion_mnist_pipeline (version: 1).
Building Docker image(s) for pipeline fashion_mnist_pipeline.
Building Docker image 123456789876.dkr.ecr.us-east-1.amazonaws.com/zenml:fashion_mnist_pipeline-orchestrator.
- Including user-defined requirements: torchvision
- Including integration requirements: boto3<=1.24.59, s3fs>2022.3.0,<=2023.4.0, sagemaker==2.117.0, torch
No .dockerignore found, including all files inside build context.
Build context size for docker image: 59.23 MiB. If you believe this is unreasonably large, make sure to include a .dockerignore file at the root of your build context /home/mushfiq/zenml_examples/sagemaker_orchestration/.dockerignore or specify a custom file in the Docker configuration when defining your pipeline.
Step 1/10 : FROM zenmldocker/zenml:0.40.1-py3.10
Step 2/10 : WORKDIR /app
Step 3/10 : COPY .zenml_user_requirements .
Step 4/10 : RUN pip install --default-timeout=60 --no-cache-dir  -r .zenml_user_requirements
Step 5/10 : COPY .zenml_integration_requirements .
Step 6/10 : RUN pip install --default-timeout=60 --no-cache-dir  -r .zenml_integration_requirements
Step 8/10 : ENV ZENML_CONFIG_PATH=/app/.zenconfig
Step 9/10 : COPY . .
Step 10/10 : RUN chmod -R a+rw .
Pushing Docker image 123456789876.dkr.ecr.us-east-1.amazonaws.com/zenml:fashion_mnist_pipeline-orchestrator.
โ•ญโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€ Traceback (most recent call last) โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ•ฎ
โ”‚ /home/mushfiq/zenml_examples/sagemaker_orchestration/run.py:18 in <module>                       โ”‚
โ”‚                                                                                                  โ”‚
โ”‚   15 from pipelines.fashion_mnist_pipeline import fashion_mnist_pipeline                         โ”‚
โ”‚   16                                                                                             โ”‚
โ”‚   17 if __name__ == "__main__":                                                                  โ”‚
โ”‚ โฑ 18 โ”‚   fashion_mnist_pipeline()                                                                โ”‚
โ”‚   19                                                                                             โ”‚
โ”‚                                                                                                  โ”‚
โ”‚ /opt/template/venv/lib/python3.10/site-packages/zenml/new/pipelines/pipeline.py:1167 in    โ”‚
โ”‚ __call__                                                                                         โ”‚
โ”‚                                                                                                  โ”‚
โ”‚   1164 โ”‚   โ”‚   โ”‚   return self.entrypoint(*args, **kwargs)                                       โ”‚
โ”‚   1165 โ”‚   โ”‚                                                                                     โ”‚
โ”‚   1166 โ”‚   โ”‚   self.prepare(*args, **kwargs)                                                     โ”‚
โ”‚ โฑ 1167 โ”‚   โ”‚   return self._run(**self._run_args)                                                โ”‚
โ”‚   1168 โ”‚                                                                                         โ”‚
โ”‚   1169 โ”‚   def _call_entrypoint(self, *args: Any, **kwargs: Any) -> None:                        โ”‚
โ”‚   1170 โ”‚   โ”‚   """Calls the pipeline entrypoint function with the given arguments.               โ”‚
โ”‚                                                                                                  โ”‚
โ”‚ /opt/template/venv/lib/python3.10/site-packages/zenml/new/pipelines/pipeline.py:597 in     โ”‚
โ”‚ _run                                                                                             โ”‚
โ”‚                                                                                                  โ”‚
โ”‚    594 โ”‚   โ”‚   โ”‚   โ”‚   deployment=deployment, local_repo_context=local_repo_context              โ”‚
โ”‚    595 โ”‚   โ”‚   โ”‚   )                                                                             โ”‚
โ”‚    596 โ”‚   โ”‚   โ”‚                                                                                 โ”‚
โ”‚ โฑ  597 โ”‚   โ”‚   โ”‚   build_model = build_utils.reuse_or_create_pipeline_build(                     โ”‚
โ”‚    598 โ”‚   โ”‚   โ”‚   โ”‚   deployment=deployment,                                                    โ”‚
โ”‚    599 โ”‚   โ”‚   โ”‚   โ”‚   pipeline_id=pipeline_id,                                                  โ”‚
โ”‚    600 โ”‚   โ”‚   โ”‚   โ”‚   allow_build_reuse=not prevent_build_reuse,                                โ”‚
โ”‚                                                                                                  โ”‚
โ”‚ /opt/template/venv/lib/python3.10/site-packages/zenml/new/pipelines/build_utils.py:96 in   โ”‚
โ”‚ reuse_or_create_pipeline_build                                                                   โ”‚
โ”‚                                                                                                  โ”‚
โ”‚    93 โ”‚   โ”‚   โ”‚   โ”‚   )                                                                          โ”‚
โ”‚    94 โ”‚   โ”‚   โ”‚   โ”‚   return existing_build                                                      โ”‚
โ”‚    95 โ”‚   โ”‚                                                                                      โ”‚
โ”‚ โฑ  96 โ”‚   โ”‚   return create_pipeline_build(                                                      โ”‚
โ”‚    97 โ”‚   โ”‚   โ”‚   deployment=deployment,                                                         โ”‚
โ”‚    98 โ”‚   โ”‚   โ”‚   pipeline_id=pipeline_id,                                                       โ”‚
โ”‚    99 โ”‚   โ”‚   โ”‚   code_repository=code_repository,                                               โ”‚
โ”‚                                                                                                  โ”‚
โ”‚ /opt/template/venv/lib/python3.10/site-packages/zenml/new/pipelines/build_utils.py:261 in  โ”‚
โ”‚ create_pipeline_build                                                                            โ”‚
โ”‚                                                                                                  โ”‚
โ”‚   258 โ”‚   โ”‚   โ”‚   โ”‚   image_name_or_digest,                                                      โ”‚
โ”‚   259 โ”‚   โ”‚   โ”‚   โ”‚   dockerfile,                                                                โ”‚
โ”‚   260 โ”‚   โ”‚   โ”‚   โ”‚   requirements,                                                              โ”‚
โ”‚ โฑ 261 โ”‚   โ”‚   โ”‚   ) = docker_image_builder.build_docker_image(                                   โ”‚
โ”‚   262 โ”‚   โ”‚   โ”‚   โ”‚   docker_settings=build_config.settings,                                     โ”‚
โ”‚   263 โ”‚   โ”‚   โ”‚   โ”‚   tag=tag,                                                                   โ”‚
โ”‚   264 โ”‚   โ”‚   โ”‚   โ”‚   stack=stack,                                                               โ”‚
โ”‚                                                                                                  โ”‚
โ”‚ /opt/template/venv/lib/python3.10/site-packages/zenml/utils/pipeline_docker_image_builder. โ”‚
โ”‚ py:302 in build_docker_image                                                                     โ”‚
โ”‚                                                                                                  โ”‚
โ”‚   299 โ”‚   โ”‚   โ”‚   โ”‚   โ”‚   โ”‚   destination=destination, source=source                             โ”‚
โ”‚   300 โ”‚   โ”‚   โ”‚   โ”‚   โ”‚   )                                                                      โ”‚
โ”‚   301 โ”‚   โ”‚   โ”‚                                                                                  โ”‚
โ”‚ โฑ 302 โ”‚   โ”‚   โ”‚   image_name_or_digest = image_builder.build(                                    โ”‚
โ”‚   303 โ”‚   โ”‚   โ”‚   โ”‚   image_name=target_image_name,                                              โ”‚
โ”‚   304 โ”‚   โ”‚   โ”‚   โ”‚   build_context=build_context,                                               โ”‚
โ”‚   305 โ”‚   โ”‚   โ”‚   โ”‚   docker_build_options=build_options,                                        โ”‚
โ”‚                                                                                                  โ”‚
โ”‚ /opt/template/venv/lib/python3.10/site-packages/zenml/image_builders/local_image_builder.p โ”‚
โ”‚ y:119 in build                                                                                   โ”‚
โ”‚                                                                                                  โ”‚
โ”‚   116 โ”‚   โ”‚   docker_utils._process_stream(output_stream)                                        โ”‚
โ”‚   117 โ”‚   โ”‚                                                                                      โ”‚
โ”‚   118 โ”‚   โ”‚   if container_registry:                                                             โ”‚
โ”‚ โฑ 119 โ”‚   โ”‚   โ”‚   return container_registry.push_image(image_name)                               โ”‚
โ”‚   120 โ”‚   โ”‚   else:                                                                              โ”‚
โ”‚   121 โ”‚   โ”‚   โ”‚   return image_name                                                              โ”‚
โ”‚   122                                                                                            โ”‚
โ”‚                                                                                                  โ”‚
โ”‚ /opt/template/venv/lib/python3.10/site-packages/zenml/container_registries/base_container_ โ”‚
โ”‚ registry.py:180 in push_image                                                                    โ”‚
โ”‚                                                                                                  โ”‚
โ”‚   177 โ”‚   โ”‚   โ”‚   )                                                                              โ”‚
โ”‚   178 โ”‚   โ”‚                                                                                      โ”‚
โ”‚   179 โ”‚   โ”‚   self.prepare_image_push(image_name)                                                โ”‚
โ”‚ โฑ 180 โ”‚   โ”‚   return docker_utils.push_image(                                                    โ”‚
โ”‚   181 โ”‚   โ”‚   โ”‚   image_name, docker_client=self.docker_client                                   โ”‚
โ”‚   182 โ”‚   โ”‚   )                                                                                  โ”‚
โ”‚   183                                                                                            โ”‚
โ”‚                                                                                                  โ”‚
โ”‚ /opt/template/venv/lib/python3.10/site-packages/zenml/utils/docker_utils.py:263 in         โ”‚
โ”‚ push_image                                                                                       โ”‚
โ”‚                                                                                                  โ”‚
โ”‚   260 โ”‚   logger.info("Pushing Docker image `%s`.", image_name)                                  โ”‚
โ”‚   261 โ”‚   docker_client = docker_client or DockerClient.from_env()                               โ”‚
โ”‚   262 โ”‚   output_stream = docker_client.images.push(image_name, stream=True)                     โ”‚
โ”‚ โฑ 263 โ”‚   aux_info = _process_stream(output_stream)                                              โ”‚
โ”‚   264 โ”‚   logger.info("Finished pushing Docker image.")                                          โ”‚
โ”‚   265 โ”‚                                                                                          โ”‚
โ”‚   266 โ”‚   image_name_without_tag, _ = image_name.rsplit(":", maxsplit=1)                         โ”‚
โ”‚                                                                                                  โ”‚
โ”‚ /opt/template/venv/lib/python3.10/site-packages/zenml/utils/docker_utils.py:357 in         โ”‚
โ”‚ _process_stream                                                                                  โ”‚
โ”‚                                                                                                  โ”‚
โ”‚   354 โ”‚   โ”‚   โ”‚   try:                                                                           โ”‚
โ”‚   355 โ”‚   โ”‚   โ”‚   โ”‚   line_json = json.loads(line)                                               โ”‚
โ”‚   356 โ”‚   โ”‚   โ”‚   โ”‚   if "error" in line_json:                                                   โ”‚
โ”‚ โฑ 357 โ”‚   โ”‚   โ”‚   โ”‚   โ”‚   raise RuntimeError(f"Docker error: {line_json['error']}.")             โ”‚
โ”‚   358 โ”‚   โ”‚   โ”‚   โ”‚   elif "stream" in line_json:                                                โ”‚
โ”‚   359 โ”‚   โ”‚   โ”‚   โ”‚   โ”‚   text = line_json["stream"].strip()                                     โ”‚
โ”‚   360 โ”‚   โ”‚   โ”‚   โ”‚   โ”‚   if "ERROR" in text:                                                    โ”‚
RuntimeError: Docker error: EOF.

htahir1 commented 1 year ago

@mushfiqulIslam Does your remote repository exist? I see here that this error might be caused if you try to push to a repository that does not exist in AWS

mushfiqulIslam commented 1 year ago

yes, a repository with name"zenml" was previously created and available. My local machines docker version: 23.0.6

htahir1 commented 1 year ago

@mushfiqulIslam Just to confirm weโ€™re talking about the docker repository

mushfiqulIslam commented 1 year ago

@htahir1, I have created an aws ecr repository but did not create any repository on docker hub.

htahir1 commented 1 year ago

Does this exist on your AWS Docker registry? 123456789876.dkr.ecr.us-east-1.amazonaws.com/zenml

mushfiqulIslam commented 1 year ago

The provided 123456789876.dkr.ecr.us-east-1.amazonaws.com/zenml is dummy. Exact one is available in AWS Docker registry and visibility is private.

htahir1 commented 1 year ago

@mushfiqulIslam Then my guess is that either that private repository does not exist or you do have permission locally to push to it

mushfiqulIslam commented 1 year ago

Found the access related issue. Basically, AWS EC2 Container registry full access was needed to upload docker image.